Moduł 1. Zadawanie pytań

1. Typologia zainteresowanych osób

Zanim rozpoczniesz działania na rzecz przejrzystości dokumentacji zbioru danych i utworzysz karty danych, musisz zidentyfikować i zaprosić zainteresowane osoby z całego cyklu życia zbioru danych. Ułatwia to tworzenie kart danych, ponieważ masz wszystko, czego potrzebujesz, aby podejmować bardziej przemyślane decyzje podczas tworzenia treści.

Aby pomóc Ci poznać i zrozumieć, jak przedstawiciele różnych działów uczestniczą w procesie cyklu życia zbioru danych, stworzyliśmy typologię, która pozwala odkrywać założenia często przyjmowane w odniesieniu do poszczególnych zainteresowanych stron. Nasza typologia dzieli się na 3 grupy zainteresowanych stron, które są zaangażowane w cykl życia zbioru danych: producenci, agenci i użytkownicy.

Ta typologia przedstawia kontinuum stale zmieniających się potrzeb i oczekiwań dotyczących zbiorów danych i ich dokumentacji. Nie ma jednego uniwersalnego rozwiązania.

Producenci

Producenci to twórcy zbiorów danych i dokumentacji, którzy odpowiadają za zbieranie, własność, udostępnianie i utrzymywanie zbiorów danych.

Producenci to osoby odpowiedzialne za tworzenie i publikowanie zbiorów danych oraz za ich wprowadzanie, rozpowszechnianie lub sukces.

Mogą to być też osoby lub grupy, które zostały zatrudnione do zbierania lub etykietowania danych oraz udzielania porad dotyczących metod lub interpretacji na różnych etapach cyklu życia danych.

W zależności od kontekstu producenci mogą też reprezentować obecnych i przyszłych członków zespołu, partnerów, klientów lub platformy hostujące dane – wszystkie te podmioty są odpowiedzialne za utrzymanie, wdrażanie i monitorowanie zbioru danych.

Agenci

Przedstawiciele to osoby, które czytają dokumentację zbioru danych lub kartę danych oraz inne dokumenty związane z modelem uczenia maszynowego (ML) i mają uprawnienia do korzystania z opisanych zbiorów danych lub systemów AI albo do decydowania o tym, jak one lub inne osoby mogą z nich korzystać.

W zależności od domeny agenci mogą pełnić rolę operacyjną lub weryfikacyjną, np. badacza w środowisku akademickim, który chce ocenić odpowiednie wykorzystanie zbioru danych, lub analityka danych w zespole produktu, który chce określić ogólną przydatność zbioru danych w kontekście integracji z produktem.

To rozróżnienie jest ważne, ponieważ recenzenci obejmują zainteresowane strony, które mogą nigdy nie korzystać bezpośrednio ze zbioru danych, ale nadal wchodzą w interakcję z kartą danych, np. konsultanci branżowi, dziennikarze śledczy, przedstawiciele społeczności i podmioty prawne. Pracownicy mogą mieć lub nie mieć wiedzy technicznej, która pozwala im poruszać się po informacjach przedstawionych w typowych dokumentach dotyczących zbiorów danych, ale często mają dostęp do specjalistycznej wiedzy w razie potrzeby.

Użytkownicy

Użytkownicy to osoby i przedstawiciele, którzy korzystają z usług opartych na modelach wytrenowanych na zbiorach danych.

Użytkownicy mogą wyrazić zgodę na udostępnianie swoich danych w ramach korzystania z usługi, ale zwykle wymagają znacznie innego zestawu wyjaśnień i ustawień w ramach korzystania z usługi, nawet w przypadku zbiorów danych.

Podsumowanie

W tabeli poniżej znajdziesz podsumowanie grup interesariuszy wraz z ich opisami, obowiązkami, przykładami i typowymi zadaniami:

Grupa zainteresowanych podmiotów

Opis

Obowiązki

Przykłady

Częste zadania

Producenci

tworzyć zbiory danych lub dokumentację;

projektować, tworzyć, testować pod kątem jakości, dokumentować, wdrażać, utrzymywać i aktualizować zbiory danych;

badacze, badacze danych i analitycy, inżynierowie oprogramowania oraz menedżerowie produktów i programów;

Wdrażanie zbiorów danych, ujawnianie informacji, przyszłościowe rozwiązania, sprawiedliwość i bezpieczeństwo oraz ulepszenia

Agenty

oceniać i wykorzystywać zbiór danych w swojej pracy, produktach, organizacjach lub społecznościach;

Używa karty danych, ale nie musi wchodzić w interakcję z samym zbiorem danych.

inżynierowie uczenia maszynowego lub produktów, badacze, dostawcy zewnętrzni, eksperci w danej dziedzinie, przedstawiciele branży, konsultanci, eksperci ds. polityki, dostawcy usług danych oraz osoby na stanowiskach kierowniczych lub menedżerskich.

Zarządzanie złożonością, odpowiedzialność, kompromisy, wdrażanie w środowisku produkcyjnym, archiwizacja

Użytkownicy

wchodzić w interakcje z produktami, urządzeniami i aplikacjami utworzonymi przez agentów, którzy korzystają z zestawów danych producenta.

mogą udostępniać swoje dane za pomocą usług i przekazywać przydatne sygnały producentom i agentom;

Osoby przekazujące dane, użytkownicy usług i przedstawiciele kohort użytkowników

Korzystanie z usług, zrozumienie danych i prywatności, przekazywanie opinii i zgłaszanie problemów

2. Mapowanie zainteresowanych osób

Teraz, gdy znasz już naszą typologię, możesz przeanalizować cykl życia zbioru danych, aby zidentyfikować zainteresowane strony za pomocą tego podstawowego ćwiczenia mapowania. Podczas wykonywania tego działania zwróć uwagę na to, kto może wchodzić w interakcje ze zbiorem danych lub jego dokumentacją. Zastanów się też, jak zainteresowane strony mogą przyczynić się do tworzenia kart danych.

Aby określić, kto jest zainteresowany Twoją firmą, wykonaj te czynności:

  1. Wymień producentów, którzy będą tworzyć karty danych.

9019cf76931e3ae5.png

  1. Wymień osoby , które będą czytać i wykorzystywać karty danych.

a6c5bfc2fadd8cb5.png

  1. Wymień użytkowników, którzy będą korzystać ze zbioru danych opisanego na karcie danych lub na których będzie on mieć wpływ.

210d18c6ec533955.png

  1. Skorzystaj z tego szablonu, aby utworzyć mapę interesariuszy, ich ról w tworzeniu kart danych i celu tych kart. Ta mapa pozwala zrozumieć, jakie są potrzeby dokumentacji zbioru danych, oraz przypisywać priorytety i odpowiedzialności w procesie tworzenia dokumentacji zbioru danych.

d24cf1a113189a25.png

3. Ścieżki informacji o agencie (AIJ)

Po określeniu zainteresowanych stron możesz zdecydować, co jest najważniejsze do przekazania pracownikom obsługi klienta – Twoim głównym zainteresowanym stronom – na karcie danych, aby zapewnić im sukces.

Zwykle doświadczenie, jakie ma osoba podczas interakcji z technologią, nazywa się ścieżką użytkownika. Mówimy jednak o agencie, który musi zdobyć wystarczającą ilość informacji o zbiorze danych, aby podjąć świadomą decyzję. Dlatego nazywamy te działania ścieżką informacyjną agenta (AIJ).

Celem AIJ jest zrozumienie:

  • Zadania, do których agenci mogą potrzebować zbioru danych.
  • Informacje, których agenci potrzebują do wykonania swoich zadań.
  • Proces, w którym agenci wyciągają wnioski na podstawie informacji.

AIJ obejmują:

51ce23c7a9aaa9e4.png

Przykład

Załóżmy na przykład, że jeden z Twoich agentów jest specjalistą ds. danych. AIJ dla analityka danych może wyglądać tak:

Jako specjalista ds. danych chcę poznać strukturę zbioru danych, więc pytam…

... jaki jest format danych?

... jaki jest rodzaj zbioru danych?

... ile jest cech w zbiorze danych?

…ile funkcji zostało zaprojektowanych?

... które cechy są ze sobą silnie skorelowane?

... jeśli w strukturze występują zależności?

Oto kolejny przykład dla agenta, który może pracować w dziale zasad dotyczących produktów i ustalać wytyczne związane z produkcją i opracowywaniem produktu:

Jako doradca ds. polityki chcę wiedzieć, jak dane mogą być niewłaściwie wykorzystywane, więc pytam…

... do czego miał służyć zbiór danych?

... która aplikacja spowodowała utworzenie zbioru danych?

... jakie są znane niebezpieczne lub ryzykowne zastosowania zbioru danych?

... jakie jest ryzyko dla poszczególnych grup?

... jak zamierzone zastosowania tego zbioru danych wpływają na grupy odbiorców?

... jak można poprosić o odszkodowanie?

4. Tworzenie AIJ

  1. Napisz kilka instrukcji do AIJ na podstawie tych promptów:

ab594f2e5ce86029.png

  1. Zwróć uwagę, że myślisz nie tylko o osobach zainteresowanych, ale także o początkowych pytaniach, na które Twoim zdaniem chcieliby uzyskać odpowiedź po przeczytaniu karty danych. Oznacza to, że jesteś o krok bliżej ostatecznego zestawu pytań, które należy uwzględnić w karcie danych.

5. Optyka

Być może zauważysz, że do opisywania AIJ używane są terminy perspektywa, obiektywzakres. Te terminy zostały zdefiniowane wcześniej, ale w rzeczywistości są częścią metafory przewodniej, którą nazywamy optyką. Stworzyliśmy je, aby pomóc Ci zastanowić się, jak Twoi agenci mogą zrozumieć Twój zbiór danych.

Zakresy

W optyce teleskopy wykorzystują soczewki i lustra do wykrywania, obserwowania, powiększania, odbijania, a nawet testowania materiałów. W kontekście zbiorów danych jest to świetna metafora, ponieważ możesz skupić się na pytaniach i je sformułować tak, aby ujawnić oczywiste, nieoczywiste, widoczne i niewidoczne aspekty.

Nazywamy to zakresami, czyli sposobem na zadawanie serii pytań w celu zrozumienia zbiorów danych. Łącząc zakresy o różnej szczegółowości, możesz tworzyć treści, które pomogą Twoim pracownikom uzyskać spójne zrozumienie zbiorów danych dzięki raportom przejrzystości.

W tabeli poniżej znajdziesz 3 typy zakresów w naszych ramach wraz z opisem, przykładem i przeznaczeniem każdego z nich:

Zakres

Opis

Przykład

Purpose

Teleskopowe

Pytania dotyczące atrybutów często występujących w wielu zbiorach danych. Oznaczają cechy.

Czy ten zbiór danych zawiera informacje umożliwiające identyfikację?

Wprowadź dodatkowe informacje i określ ich kontekst, aby pomóc pracownikom obsługi klienta w korzystaniu z karty danych lub artefaktu przejrzystości.

peryskopowy,

Pytania dotyczące atrybutów specyficznych dla zbioru danych producenta. Opisują one obserwacje.

Ile funkcji zawiera informacje umożliwiające identyfikację osób?

Zwykle zarezerwowane na potrzeby udostępniania informacji operacyjnych, takich jak kształt i rozmiar zbioru danych, lub informacji funkcjonalnych, takich jak źródła lub intencje.

mikroskopijny,

Pytania dotyczące nieobserwowalnych aspektów zbiorów danych, takich jak decyzje, procesy i wpływ. Domagają się wyjaśnień.

W jaki sposób w tym zbiorze danych zanonimizowano informacje umożliwiające identyfikację?

Uzyskuj szczegółowe wyjaśnienia decyzji lub podsumowania dłuższych dokumentów procesowych, które regulują odpowiedzi na odpowiednie pytania peryskopowe i teleskopowe.

Podczas tworzenia karty danych pamiętaj o tych 3 rodzajach zakresów. Karta danych zawierająca tylko teleskopy opisuje oczywiste informacje o zbiorze danych i nie wnosi żadnej wartości. Karta danych zawierająca tylko peryskopy może być zbyt techniczna, bez szczegółów dotyczących kontekstu, trafności lub znaczenia. Karta danych zawierająca tylko mikroskopy może spowodować, że pracownicy łatwo zagubią się w szczegółach i stracą z oczu ogólny obraz.

Dlatego interpretacje karty danych są w dużej mierze uzależnione od obecności lub braku tych poziomów zakresów. Te pytania pozwalają agentom i producentom ocenić ryzyko, zaplanować działania ograniczające i w odpowiednich przypadkach określić możliwości lepszego tworzenia zbiorów danych. Teleskopy, peryskopy i mikroskopy dostarczają przydatnych szczegółów, dzięki czemu wiele zainteresowanych osób może poruszać się po karcie danych bez dezorientacji i zagubienia.

Przykład

W sekcji Ścieżki informacji dla pracowników obsługi klienta (AIJ) znajdziesz przykłady AIJ, w tym jeden dla specjalisty ds. danych. Jeśli przyjrzysz się bliżej temu przykładowi, możesz zauważyć, że niektóre z tych pytań można pogrupować według zakresów, np. te:

Jako specjalista ds. danych chcę poznać strukturę zbioru danych, więc pytam…

Teleskopowe

... jaki jest format danych?

... jaki jest rodzaj zbioru danych?

Periscopic

... ile jest cech w zbiorze danych?

…ile funkcji zostało zaprojektowanych?

Mikroskopijne

... które cechy są ze sobą silnie skorelowane?

... jeśli w strukturze występują zależności?

Bardzo prawdopodobne, że masz już pytania dotyczące perspektywy teleskopowej, peryskopowej i mikroskopowej, które możesz zadać swoim agentom.

6. Restrukturyzacja AIJ za pomocą zakresów

  • Aby zmienić strukturę AIJ za pomocą zakresów, użyj tego przykładowego prompta:

2b6e2a7a041060f4.png

7. Gratulacje

Gratulacje! Rozpoczęto tworzenie karty danych. Teraz możesz ocenić pytania.