Modulo 1: Chiedere

1. Tipologia di stakeholder

Prima di iniziare a lavorare sulla trasparenza della documentazione del set di dati e creare le schede dei dati, è importante identificare e invitare gli stakeholder di tutto il ciclo di vita del set di dati. In questo modo, è più facile creare schede di dati perché ti fornisce tutto ciò che ti serve per fare considerazioni più solide durante la creazione dei contenuti.

Per aiutarti a esplorare e comprendere il modo in cui gli stakeholder interfunzionali partecipano al ciclo di vita di un set di dati, abbiamo creato una tipologia che ti consente di scoprire le ipotesi spesso formulate sui singoli stakeholder. La nostra tipologia è suddivisa in tre gruppi di stakeholder coinvolti nel ciclo di vita di un set di dati: produttori, agenti e utenti.

Questa tipologia rappresenta un continuum di esigenze e aspettative in continua evoluzione da parte dei set di dati e della relativa documentazione. Non esiste una soluzione universale.

Produzione

I produttori sono i creatori di set di dati e documentazione e sono responsabili della raccolta, della proprietà, del lancio e della manutenzione dei set di dati.

In sostanza, puoi considerare i produttori come i responsabili della produzione e della pubblicazione dei set di dati, nonché del lancio, dell'adozione e/o del successo.

I produttori potrebbero anche essere le persone o i gruppi reclutati per raccogliere o etichettare i dati e fornire consulenza su metodi o interpretazione in vari punti del ciclo di vita dei dati.

A seconda del contesto, i produttori potrebbero anche rappresentare i tuoi attuali e futuri membri del team, partner, clienti o piattaforme di hosting dei dati, tutti responsabili della manutenzione, dell'implementazione e del monitoraggio del set di dati.

Agenti

Gli agenti sono stakeholder che leggono la documentazione del set di dati o della scheda dei dati e altra documentazione relativa al modello di machine learning (ML) e hanno la facoltà di utilizzare o determinare come loro o altri potrebbero utilizzare i set di dati o i sistemi di AI descritti.

A seconda dei loro domini, gli agenti potrebbero avere un ruolo operativo o di revisore, ad esempio un ricercatore in un contesto accademico che vuole valutare l'utilizzo appropriato di un set di dati o un data scientist in un team di prodotto che vuole determinare l'idoneità complessiva del set di dati in relazione all'integrazione del prodotto.

Questa distinzione è importante perché i revisori includono le parti interessate che potrebbero non utilizzare mai direttamente il set di dati, ma interagire comunque con la scheda dei dati, come consulenti del settore, giornalisti investigativi, rappresentanti della community e persone giuridiche. Gli agenti potrebbero o meno possedere le competenze tecniche per navigare tra le informazioni presentate nella documentazione tipica dei set di dati, ma spesso hanno accesso alle competenze necessarie.

Utenti

Gli utenti sono persone e rappresentanti che interagiscono con prodotti che si basano su modelli addestrati su set di dati.

Gli utenti potrebbero acconsentire a fornire i propri dati nell'ambito dell'esperienza con il prodotto, ma in genere richiedono un insieme di spiegazioni e controlli significativamente diverso basato sulle esperienze con il prodotto, anche per quanto riguarda i set di dati.

Riepilogo

La seguente tabella riassume i gruppi di stakeholder in base a descrizioni, responsabilità, esempi e attività comuni:

Gruppo di stakeholder

Descrizione

Responsabilità

Esempi

Attività comuni

Produttori

Creare set di dati e/o documentazione.

Progettare, creare, testare la qualità, documentare, lanciare, adottare, mantenere e aggiornare i set di dati.

Ricercatori, data scientist e analisti, ingegneri del software e product e program manager

Adozione, divulgazione, protezione futura, equità e sicurezza dei set di dati e miglioramenti

Agenti

Valutare e utilizzare il set di dati per il proprio lavoro, i propri prodotti, le proprie organizzazioni o le proprie comunità.

Utilizza la scheda dei dati, ma potrebbe non interagire con il set di dati stesso.

Ingegneri ML o di prodotto, ricercatori, fornitori terzi, esperti in materia, settore, consulenti, esperti di policy, fornitori di servizi di dati e leadership o gestione

Gestire la complessità, essere responsabili, fare compromessi, eseguire il deployment in produzione, archiviare

Utenti

Interagisci con i prodotti, i dispositivi e le app creati da agenti che utilizzano i set di dati del produttore.

Potrebbero contribuire con i propri dati tramite i prodotti e fornire segnali utili per produttori e agenti.

Collaboratori dei dati, utenti del prodotto e rappresentanti delle coorti di utenti

Utilizzare i prodotti, comprendere i dati e la privacy, fornire feedback e sollevare dubbi

2. Mappare le parti interessate

Ora che hai acquisito familiarità con la nostra tipologia, puoi esaminare il ciclo di vita del tuo set di dati per identificare i tuoi stakeholder tramite questa attività di mappatura di base. Man mano che svolgi l'attività, prendi nota di chi potrebbe interagire con il set di dati o la relativa documentazione. Inoltre, valuta in che modo gli stakeholder potrebbero contribuire alle schede dei dati.

Per mappare gli stakeholder:

  1. Elenca i produttori che creeranno le schede dei dati.

9019cf76931e3ae5.png

  1. Elenca gli agenti che leggeranno e utilizzeranno le schede dei dati.

a6c5bfc2fadd8cb5.png

  1. Elenca gli utenti che utilizzeranno o saranno interessati dal set di dati descritto nella scheda dei dati.

210d18c6ec533955.png

  1. Utilizza il seguente modello per creare una mappa dei tuoi stakeholder, dei loro ruoli nella creazione delle schede di dati e dello scopo delle loro schede di dati. Questa mappa ti consente di comprendere intuitivamente le esigenze a valle della documentazione del set di dati e di assegnare priorità e responsabilità durante l'intero processo di documentazione del set di dati.

d24cf1a113189a25.png

3. Percorsi delle informazioni agente (AIJ)

Una volta mappate le parti interessate, puoi determinare cosa è essenziale comunicare agli agenti, le tue parti interessate principali, nella scheda Dati, in modo da prepararli al successo.

In genere, l'esperienza di una persona quando interagisce con la tecnologia è chiamata percorso dell'utente. Tuttavia, stiamo parlando di un agente che deve acquisire informazioni sufficienti su un set di dati per prendere una decisione informata, quindi chiamiamo queste esperienze percorso informativo dell'agente (AIJ).

Lo scopo di un'AIJ è comprendere quanto segue:

  • Le attività per le quali gli agenti potrebbero volere un set di dati.
  • Le informazioni necessarie agli agenti per completare le loro attività.
  • Il processo mediante il quale gli agenti deducono le informazioni.

Gli AIJ includono:

51ce23c7a9aaa9e4.png

Esempio

Ad esempio, supponiamo che uno dei tuoi agenti sia un data scientist. Un AIJ per un data scientist potrebbe avere il seguente aspetto:

In qualità di data scientist, voglio conoscere la struttura del set di dati, quindi chiedo…

... qual è il formato dei dati?

... qual è la modalità del set di dati?

... quanti attributi ci sono nel set di dati?

... quante funzionalità sono progettate?

... quali funzionalità sono fortemente correlate?

... se sono presenti dipendenze nella struttura?

Ecco un altro esempio per un agente che potrebbe lavorare nelle norme relative ai prodotti e stabilisce linee guida relative alla produzione e allo sviluppo di un prodotto:

In qualità di assistente per le norme, voglio sapere come potrebbero essere utilizzati in modo improprio i dati, quindi chiedo…

... qual era l'utilizzo previsto del set di dati?

... quale applicazione ha richiesto la creazione del set di dati?

... quali sono le applicazioni pericolose o rischiose note del set di dati?

... qual è il rischio per gruppi specifici?

... in che modo gli utilizzi previsti di questo set di dati influiscono sui collegi elettorali?

... come si può chiedere un ricorso?

4. Scrivere i tuoi AIJ

  1. Scrivi alcune AIJ in base ai seguenti prompt:

ab594f2e5ce86029.png

  1. Nota come non solo tieni a mente i tuoi stakeholder, ma anche alcune domande iniziali a cui pensi che vorrebbero rispondere leggendo la tua scheda dei dati. Ciò significa che ti stai avvicinando al set finale di domande da includere nella scheda dei dati.

5. Ottica

Potresti aver notato l'uso dei termini prospettiva, obiettivo e ambito per inquadrare le AIJ. Sebbene questi termini siano stati definiti in precedenza, fanno parte di una metafora guida che chiamiamo ottica. Li abbiamo creati per aiutarti a capire come gli agenti potrebbero arrivare a comprendere il tuo set di dati.

Ambiti

In ottica, i cannocchiali utilizzano lenti e specchi per individuare, osservare, ingrandire, riflettere e persino testare i materiali. Nel contesto dei set di dati, è un'ottima metafora perché ti concentri e inquadri le domande per rivelare aspetti ovvi, non ovvi, visibili e invisibili.

Ci riferiamo a questo come ambiti, un modo per porre una serie di domande in successione per dare un senso ai set di dati. Se impili ambiti di granularità diversa, puoi creare contenuti che aiutino i tuoi agenti a stabilire una comprensione coerente dei set di dati tramite i report sulla trasparenza.

La tabella seguente contiene i tre tipi di ambiti del nostro framework, insieme a una descrizione, un esempio e lo scopo di ciascuno:

Ambito

Descrizione

Esempio

Purpose

Telescopico

Domande sugli attributi comunemente presenti in più set di dati. Taggano le caratteristiche.

Questo set di dati contiene informazioni che consentono l'identificazione personale (PII)?

Introduci e imposta il contesto per ulteriori informazioni che aiutano gli agenti a navigare nella scheda dati o nell'artefatto di trasparenza.

Periscopico

Domande sugli attributi specifici per il set di dati del produttore. Descrivono le osservazioni.

Quante funzionalità contengono dati personali?

Generalmente riservati alla fornitura di informazioni operative, come la forma e le dimensioni del set di dati, o di informazioni funzionali, come le origini o le intenzioni.

Microscopico

Domande sugli aspetti non osservabili dei set di dati, come decisioni, processi e impatti. Chiedono spiegazioni.

In che modo le PII sono state rese anonime in questo set di dati?

Richiedi spiegazioni dettagliate delle decisioni o riassumi documenti di processo più lunghi che regolano le risposte alle domande periscopiche e telescopiche corrispondenti.

È importante che tu prenda in considerazione questi tre tipi di ambiti durante la procedura di creazione della scheda dati. Una scheda dati con solo telescopi descrive solo informazioni ovvie sul set di dati e non aggiunge alcun valore distinto. Una scheda dati con solo periscopi può diventare eccessivamente tecnica senza dettagli su contesto, pertinenza o importanza. Una scheda dati con solo microscopi potrebbe far perdere facilmente agli agenti i dettagli e la visione d'insieme.

Per questo motivo, riteniamo che le interpretazioni di una scheda dati siano fortemente influenzate dalla presenza o dall'assenza di questi livelli di ambiti. Queste domande consentono ad agenti e produttori di valutare il rischio, pianificare le mitigazioni e, se pertinente, identificare le opportunità per una migliore creazione di set di dati. Telescopi, periscopi e microscopi forniscono insieme dettagli utili in modo che numerosi stakeholder possano navigare nella tua scheda dati senza perdersi.

Esempio

Nella sezione Percorsi delle informazioni dell'agente (AIJ), hai visto alcuni esempi di AIJ, tra cui uno per un data scientist. Se esamini attentamente l'esempio, potresti scoprire che puoi raggruppare alcune di queste domande per ambiti, tra cui le seguenti:

In qualità di data scientist, voglio conoscere la struttura del set di dati, quindi chiedo…

Telescopico

... qual è il formato dei dati?

... qual è la modalità del set di dati?

Periscopico

... quanti attributi ci sono nel set di dati?

... quante funzionalità sono progettate?

Microscopico

... quali funzionalità sono fortemente correlate?

... se sono presenti dipendenze nella struttura?

È molto probabile che tu abbia già pensato a domande telescopiche, periscopiche e microscopiche tenendo a mente i tuoi agenti.

6. Ristrutturare le AIJ con gli ambiti

  • Per ristrutturare i tuoi AIJ con gli ambiti, utilizza il seguente prompt di esempio:

2b6e2a7a041060f4.png

7. Complimenti

Complimenti! Hai iniziato a creare una scheda dei dati. Ora è tutto pronto per valutare le tue domande.