1. Tipología de las partes interesadas
Antes de comenzar con tus esfuerzos de transparencia en la documentación de conjuntos de datos y crear Data Cards, es importante que identifiques e invites a las partes interesadas de todo el ciclo de vida del conjunto de datos. Esto facilita la creación de tarjetas de datos, ya que te proporciona todo lo que necesitas para tomar decisiones más fundamentadas a medida que creas contenido.
Para ayudarte a explorar y comprender cómo los interesados interfuncionales participan en el proceso del ciclo de vida de un conjunto de datos, creamos una tipología que te permite descubrir las suposiciones que a menudo se hacen sobre los interesados individuales. Nuestra tipología se divide en tres grupos de partes interesadas que participan en el ciclo de vida de un conjunto de datos: productores, agentes y usuarios.
Esta tipología representa un continuo de necesidades y expectativas en constante cambio de los conjuntos de datos y su documentación. No existe una solución única para todos.
Productores
Los productores son los creadores de los conjuntos de datos y la documentación, y son responsables de la recopilación, la propiedad, el lanzamiento y el mantenimiento de los conjuntos de datos.
En esencia, puedes considerar a los productores como los responsables de la producción y publicación de conjuntos de datos, y del lanzamiento, la adopción o el éxito.
Los productores también podrían ser las personas o los grupos reclutados para recopilar o etiquetar los datos, y brindar asesoramiento sobre los métodos o la interpretación en varios puntos durante el ciclo de vida de los datos.
Según el contexto, los productores también podrían representar a los miembros actuales y futuros de tu equipo, socios, clientes o plataformas de alojamiento de datos, todos responsables del mantenimiento, la implementación y la supervisión de los conjuntos de datos.
Agentes
Los agentes son partes interesadas que leen la documentación de tu conjunto de datos o la Tarjeta de datos, y otros documentos relacionados con el modelo de aprendizaje automático (AA), y tienen la capacidad de usar o determinar cómo ellos u otros podrían usar los conjuntos de datos o los sistemas de IA descritos.
Según sus dominios, los agentes podrían tener un rol operativo o de revisor, como un investigador en un entorno académico que desea evaluar el uso adecuado de un conjunto de datos o un científico de datos en un equipo de productos que desea determinar el ajuste general del conjunto de datos en relación con la integración del producto.
Esta distinción es importante porque los revisores incluyen a las partes interesadas que tal vez nunca usen directamente el conjunto de datos, pero que sí interactúan con la tarjeta de datos, como los consultores de la industria, los periodistas de investigación, los representantes de la comunidad y las entidades legales. Es posible que los agentes tengan o no la experiencia técnica para navegar por la información que se presenta en la documentación típica de los conjuntos de datos, pero a menudo tienen acceso a la experiencia según sea necesario.
Usuarios
Los usuarios son personas físicas y representantes que interactúan con productos que dependen de modelos entrenados con conjuntos de datos.
Es posible que los usuarios den su consentimiento para proporcionar sus datos como parte de la experiencia del producto, pero, por lo general, requieren un conjunto de explicaciones y controles significativamente diferentes fundamentados en las experiencias del producto, incluso cuando se trata de conjuntos de datos.
Resumen
En la siguiente tabla, se resumen los grupos de partes interesadas según sus descripciones, responsabilidades, ejemplos y tareas comunes:
Grupo de partes interesadas | Descripción | Responsabilidades | Ejemplos | Tareas comunes |
Productores | Crear conjuntos de datos o documentación | Diseñar, crear, probar la calidad, documentar, lanzar, adoptar, mantener y actualizar conjuntos de datos | Investigadores, analistas y científicos de datos, ingenieros de software y administradores de productos y programas | Adopción, divulgación, preparación para el futuro, equidad y seguridad de los conjuntos de datos, y mejoras |
Agentes | Evaluar y usar el conjunto de datos para su trabajo, productos, organizaciones o comunidades | Usan la tarjeta de datos, pero es posible que no interactúen con el conjunto de datos en sí. | Ingenieros de AA o de productos, investigadores, proveedores externos, expertos en la materia, industria, consultores, expertos en políticas, proveedores de servicios de datos y liderazgo o administración | Administrar la complejidad, asumir la responsabilidad, hacer concesiones, implementar en producción, archivar |
Usuarios | Interactuar con los productos, dispositivos y apps creados por agentes que usan los conjuntos de datos del productor | Es posible que aporten sus datos a través de productos y proporcionen indicadores útiles para los productores y los agentes. | Colaboradores de datos, usuarios de productos y representantes de cohortes de usuarios | Usar productos, comprender los datos y la privacidad, proporcionar comentarios y plantear inquietudes |
2. Crea un mapa de tus interesados
Ahora que conoces nuestra tipología, puedes revisar el ciclo de vida de tu conjunto de datos para identificar a tus partes interesadas a través de esta actividad de asignación básica. A medida que realices la actividad, toma nota de quién podría interactuar con el conjunto de datos o su documentación. Además, considera cómo las partes interesadas podrían contribuir a las Tarjetas de datos.
Para mapear a tus partes interesadas, sigue estos pasos:
- Enumera los productores que crearán las tarjetas de datos.
- Enumera los agentes que leerán y usarán las tarjetas de datos.
- Enumera los usuarios que usarán el conjunto de datos o se verán afectados por él, tal como se describe en la tarjeta de datos.
- Usa la siguiente plantilla para crear un mapa de tus partes interesadas, sus roles en la creación de tarjetas de datos y el propósito de sus tarjetas de datos. Este mapa te brinda una intuición sobre las necesidades posteriores de la documentación del conjunto de datos y la capacidad de asignar prioridades y responsabilidades a lo largo del proceso de documentación del conjunto de datos.
3. Procesos de información del agente (AIJ)
Una vez que hayas identificado a tus partes interesadas, podrás determinar qué es esencial transmitir a los agentes (tus principales partes interesadas) en tu tarjeta de datos para que puedan tener éxito.
Por lo general, la experiencia que tiene una persona cuando interactúa con la tecnología se denomina recorrido del usuario. Sin embargo, hablamos de un agente que necesita adquirir suficiente información sobre un conjunto de datos para tomar una decisión fundamentada, por lo que llamamos a estas experiencias recorrido de información del agente (AIJ).
El objetivo de un AIJ es comprender lo siguiente:
- Son las tareas para las que los agentes podrían querer un conjunto de datos.
- Es la información que los agentes necesitan para completar sus tareas.
- Proceso por el cual los agentes deducen información.
Las AIJ incluyen lo siguiente:
Ejemplo
Por ejemplo, supongamos que uno de tus agentes es un científico de datos. Un AIJ para un científico de datos podría verse de la siguiente manera:
Como científico de datos, quiero conocer la estructura del conjunto de datos, por lo que pregunto…
… ¿cuál es el formato de los datos?
… ¿cuál es la modalidad del conjunto de datos?
… ¿cuántas características hay en el conjunto de datos?
… ¿cuántos atributos se diseñan?
… ¿qué características están altamente correlacionadas?
… si hay dependencias en la estructura?
Este es otro ejemplo para un agente que podría trabajar en la política de productos y establecer lineamientos relacionados con la producción y el desarrollo de un producto:
Como asesor de políticas, quiero saber cómo se podrían usar los datos de forma inadecuada, por lo que pregunto…
… ¿cuál era el uso previsto del conjunto de datos?
… ¿qué aplicación solicitó la creación del conjunto de datos?
… ¿cuáles son las aplicaciones peligrosas o riesgosas conocidas del conjunto de datos?
… ¿cuál es el riesgo para grupos específicos?
… ¿cómo afectan los usos previstos de este conjunto de datos a los distritos electorales?
… ¿cómo se puede solicitar una compensación?
4. Escribe tus AIJ
- Escribe algunos AIJ según las siguientes instrucciones:
- Observa cómo no solo tienes en cuenta a tus partes interesadas, sino también algunas preguntas iniciales que crees que les gustaría que se respondieran después de leer tu Tarjeta de datos. Esto significa que estás un paso más cerca del conjunto final de preguntas que debes incluir en tu tarjeta de datos.
5. Óptica
Es posible que hayas notado el uso de los términos perspectiva, lente y alcance para enmarcar los AIJ. Si bien estos términos se definieron anteriormente, en realidad forman parte de una metáfora guía que llamamos óptica. Los creamos para ayudarte a pensar cómo tus agentes podrían llegar a comprender tu conjunto de datos.
Permisos
En óptica, los visores usan lentes y espejos para detectar, observar, magnificar, reflejar y hasta probar materiales. En el contexto de los conjuntos de datos, es una metáfora excelente porque te enfocas y formulas preguntas para revelar aspectos obvios, no obvios, visibles e invisibles.
Nos referimos a esto como alcances, un medio para hacer una serie de preguntas de forma sucesiva para comprender los conjuntos de datos. Si apilas los alcances de diferentes granularidades, puedes crear contenido que ayude a tus agentes a establecer una comprensión coherente de los conjuntos de datos a través de los informes de transparencia.
En la siguiente tabla, se incluyen los tres tipos de alcances de nuestro marco de trabajo, junto con una descripción, un ejemplo y el propósito de cada uno:
Alcance | Descripción | Ejemplo | Purpose |
Telescópica | Preguntas sobre atributos que se suelen encontrar en varios conjuntos de datos Etiquetan características. | ¿Este conjunto de datos contiene información de identificación personal (PII)? | Presenta y establece el contexto de la información adicional que ayuda a tus agentes a navegar por tu tarjeta de datos o artefacto de transparencia. |
Periscópico | Preguntas sobre atributos específicos del conjunto de datos del productor Describen observaciones. | ¿Cuántas funciones contienen PII? | Por lo general, se reserva para proporcionar información operativa, como la forma y el tamaño del conjunto de datos, o información funcional, como las fuentes o las intenciones. |
Microscópico | Preguntas sobre aspectos no observables de los conjuntos de datos, como decisiones, procesos e impactos Exigen explicaciones. | ¿Cómo se anonimizaron los datos de PII en este conjunto de datos? | Obtener explicaciones detalladas de las decisiones o resumir documentos de procesos más largos que rigen las respuestas a las preguntas periscópicas y telescópicas correspondientes |
Es importante que tengas en cuenta estos tres tipos de alcances durante todo el proceso de creación de la Tarjeta de datos. Una tarjeta de datos que solo incluye telescopios describe información obvia sobre tu conjunto de datos y no agrega ningún valor distintivo. Una tarjeta de datos que solo incluye periscopios puede volverse demasiado técnica sin detalles sobre el contexto, la relevancia o la importancia. Una tarjeta de datos con solo microscopios podría hacer que los agentes se pierdan fácilmente en los detalles y pierdan de vista el panorama general.
Por eso, observamos que las interpretaciones de una tarjeta de datos se ven muy influenciadas por la presencia o ausencia de estos niveles de alcance. Estas preguntas permiten que los agentes y productores evalúen el riesgo, planifiquen mitigaciones y, cuando corresponda, identifiquen oportunidades para crear mejores conjuntos de datos. En conjunto, los telescopios, los periscopios y los microscopios proporcionan detalles útiles para que las numerosas partes interesadas puedan navegar por tu Tarjeta de datos sin desorientarse ni perderse.
Ejemplo
En la sección Agent information journeys (AIJs), viste algunos ejemplos de AIJs, incluido uno para un científico de datos. Si observas de cerca ese ejemplo, es posible que descubras que puedes agrupar algunas de esas preguntas por alcances, incluidas las siguientes:
Como científico de datos, quiero conocer la estructura del conjunto de datos, por lo que pregunto…
Telescópica
… ¿cuál es el formato de los datos?
… ¿cuál es la modalidad del conjunto de datos?
Periscopic
… ¿cuántas características hay en el conjunto de datos?
… ¿cuántos atributos se diseñan?
Microscópico
… ¿qué características están altamente correlacionadas?
… si hay dependencias en la estructura?
Es muy probable que ya hayas pensado en algunas preguntas telescópicas, periscópicas y microscópicas con tus agentes en mente.
6. Reestructura tus AIJ con permisos
- Para reestructurar tus AIJ con alcances, usa la siguiente instrucción de ejemplo:
7. Felicitaciones
¡Felicitaciones! Comenzaste a crear una tarjeta de datos. Ahora puedes evaluar tus preguntas.