1. Paydaşların sınıflandırılması
Veri kümesi dokümanı şeffaflığı çalışmalarına başlamadan ve veri kartları oluşturmadan önce, veri kümesi yaşam döngüsünün tamamındaki paydaşları belirlemeniz ve davet etmeniz önemlidir. Bu sayede, içerik oluştururken daha güçlü değerlendirmeler yapmanızı sağlayacak her şeye sahip olacağınız için veri kartları oluşturmak kolaylaşır.
Farklı işlevlere sahip paydaşların bir veri kümesinin yaşam döngüsü sürecine nasıl dahil olduğunu keşfetmenize ve anlamanıza yardımcı olmak için, tek tek paydaşlar hakkında sıkça yapılan varsayımları ortaya çıkarmanızı sağlayan bir tipoloji oluşturduk. Tipolojimiz, bir veri kümesinin yaşam döngüsüne dahil olan üç paydaş grubuna ayrılmıştır: üreticiler, aracılar ve kullanıcılar.
Bu tipoloji, veri kümeleri ve bunların dokümanlarıyla ilgili sürekli değişen ihtiyaç ve beklentilerin bir devamlılığını temsil eder. Herkese uyan tek bir çözüm yoktur.
Yapımcılar
Üreticiler, veri kümeleri ve belgeler oluşturur. Veri kümesi toplama, sahiplik, kullanıma sunma ve bakım işlemlerinden sorumludur.
Üreticiler, temel olarak veri kümelerinin üretimi ve yayınlanması, başlatılması, benimsenmesi ve/veya başarısından sorumlu olan kişilerdir.
Üreticiler, verileri toplamak veya etiketlemek için işe alınan kişiler ya da gruplar da olabilir ve veri yaşam döngüsü boyunca çeşitli noktalarda yöntemler veya yorumlama konusunda tavsiye verebilirler.
Üreticiler, bağlama bağlı olarak mevcut ve gelecekteki ekip üyelerinizi, iş ortaklarınızı, müşterilerinizi veya veri barındırma platformlarınızı da temsil edebilir. Bunların tümü veri kümesi bakımı, güncellenmesi, dağıtımı ve izlenmesinden sorumludur.
Aracılar
Aracılar, veri kümesi dokümanlarınızı veya veri kartınızı ve makine öğrenimi (ML) modeliyle ilgili diğer dokümanları okuyan, açıklanan veri kümelerini veya yapay zeka sistemlerini nasıl kullanacaklarını ya da başkalarının nasıl kullanabileceğini belirleme yetkisine sahip paydaşlardır.
Alanlarına bağlı olarak, aracıların operasyonel veya inceleme rolü olabilir. Örneğin, akademik ortamda bir veri kümesinin uygun kullanımını ölçmek isteyen bir araştırmacı veya bir ürün ekibinde veri kümesinin ürün entegrasyonuyla ilgili genel uygunluğunu belirlemek isteyen bir veri bilimcisi bu rollerde olabilir.
Bu ayrım önemlidir. Çünkü inceleme yapanlar arasında, veri kümesini doğrudan kullanmayabilecek ancak yine de Veri Kartı ile etkileşim kuran paydaşlar (ör. sektör danışmanları, araştırmacı gazeteciler, topluluk temsilcileri ve tüzel kişiler) yer alır. Temsilciler, normal veri kümesi dokümanlarında sunulan bilgilerde gezinmek için gerekli teknik uzmanlığa sahip olabilir veya olmayabilir ancak genellikle gerektiğinde uzmanlığa erişebilirler.
Kullanıcı sayısı
Kullanıcılar, veri kümeleri üzerinde eğitilmiş modellere dayalı ürünlerle etkileşime giren kişiler ve temsilcilerdir.
Kullanıcılar, ürün deneyiminin bir parçası olarak verilerini sağlamayı kabul edebilir ancak veri kümeleri söz konusu olduğunda bile genellikle ürün deneyimlerine dayalı, önemli ölçüde farklı bir dizi açıklama ve kontrol isterler.
Özet
Aşağıdaki tabloda paydaş grupları açıklamaları, sorumlulukları, örnekleri ve yaygın görevleri ile özetlenmiştir:
Paydaş grubu | Açıklama | Sorumluluklar | Örnekler | Genel görevler |
Producers | Veri kümeleri ve/veya dokümanlar oluşturun. | Veri kümelerini tasarlama, oluşturma, kalite testine tabi tutma, belgeleme, kullanıma sunma, benimseme, sürdürme ve güncelleme. | Araştırmacılar, veri bilimciler ve analistler, yazılım mühendisleri, ürün ve program yöneticileri | Veri kümesi kullanımı, açıklama, geleceğe hazırlık, adalet ve güvenlik ile iyileştirmeler |
Aracılar | Veri kümesini değerlendirip işlerinde, ürünlerinde, kuruluşlarında veya topluluklarında kullanabilirler. | Veri kartını kullanabilir ancak veri kümesiyle etkileşime geçemeyebilir. | Makine öğrenimi veya ürün mühendisleri, araştırmacılar, üçüncü taraf tedarikçiler, konu uzmanları, sektör, danışmanlar, politika uzmanları, veri hizmeti sağlayıcılar ve liderlik veya yönetim | Karmaşıklığı yönetme, hesap verebilirlik, ödün verme, üretime dağıtma, arşivleme |
Kullanıcılar | Üreticinin veri kümelerini kullanan temsilciler tarafından oluşturulan ürünler, cihazlar ve uygulamalarla etkileşim kurma | Ürünler aracılığıyla verilerine katkıda bulunabilir ve üreticiler ile temsilciler için faydalı sinyaller sağlayabilir. | Veri katkıda bulunanlar, ürün kullanıcıları ve kullanıcı gruplarının temsilcileri | Ürünleri kullanma, verileri ve gizliliği anlama, geri bildirim sağlama ve endişeleri bildirme |
2. Paydaşlarınızı haritalandırma
Tipolojimizi öğrendiğinize göre, bu temel eşleme etkinliği aracılığıyla paydaşlarınızı belirlemek için veri kümenizin yaşam döngüsünü inceleyebilirsiniz. Etkinliği tamamlarken veri kümesiyle veya dokümanlarıyla kimlerin etkileşimde bulunabileceğini not edin. Ayrıca, paydaşların veri kartlarına nasıl katkıda bulunabileceğini de göz önünde bulundurun.
Paydaşlarınızı haritalandırmak için aşağıdaki adımları uygulayın:
- Veri kartlarını oluşturacak üreticileri listeleyin.
- Veri kartlarını okuyacak ve kullanacak aracıları listeleyin.
- Veri kartında açıklanan veri kümesini kullanacak veya veri kümesinden etkilenecek kullanıcıları listeleyin.
- Paydaşlarınızın, veri kartlarının oluşturulmasındaki rollerinin ve veri kartlarının amacının haritasını oluşturmak için aşağıdaki şablonu kullanın. Bu harita, veri kümesi dokümanlarının sonraki aşamalardaki ihtiyaçları hakkında fikir edinmenizi ve veri kümesi dokümanı oluşturma sürecinde öncelikler ve sorumluluklar atamanızı sağlar.
3. Temsilci bilgileri yolculukları (AIJ'ler)
Paydaşlarınızın haritasını çıkardıktan sonra, veri kartınızda temsilcilere (birincil paydaşlarınız) iletmeniz gereken temel bilgileri belirleyebilir ve onları başarıya hazırlayabilirsiniz.
Genellikle bir kişinin teknolojiyle etkileşim kurarken yaşadığı deneyime kullanıcı yolculuğu denir. Ancak burada, bilinçli bir karar vermek için bir veri kümesi hakkında yeterli bilgi edinmesi gereken bir aracıdan bahsediyoruz. Bu nedenle bu deneyimlere Aracı bilgi yolculuğu (AIJ) diyoruz.
Bir AIJ'nin amacı şunları anlamaktır:
- Temsilcilerin veri kümesi isteyebileceği görevler.
- Temsilcilerin görevlerini tamamlamak için ihtiyaç duyduğu bilgiler.
- Temsilcilerin bilgileri çıkardığı süreç.
Yapay zeka gazeteciliği şunları içerir:
Örnek
Örneğin, temsilcilerinizden birinin veri bilimci olduğunu varsayalım. Bir veri bilimcisi için AIJ şu şekilde görünebilir:
Veri bilimci olarak veri kümesinin yapısını öğrenmek istiyorum. Bu nedenle, aşağıdaki soruyu soruyorum:
... veri biçimi nedir?
... veri kümesinin modalitesi nedir?
... veri kümesinde kaç özellik var?
... kaç özellik tasarlanmıştır?
... hangi özellikler arasında güçlü bir korelasyon var?
... yapıda bağımlılıklar varsa?
Ürün politikası alanında çalışan ve bir ürünün üretimi ve geliştirilmesiyle ilgili kurallar belirleyen bir temsilci için başka bir örnek:
Politika danışmanı olarak verilerin nasıl kötüye kullanılabileceğini öğrenmek istiyorum. Bu nedenle soruyorum:
... veri kümesinin amaçlanan kullanımı neydi?
... hangi uygulama veri kümesinin oluşturulmasına neden oldu?
... veri kümesinin bilinen tehlikeli veya riskli uygulamaları nelerdir?
... belirli gruplar için risk nedir?
... bu veri kümesinin amaçlanan kullanımları, seçmenleri nasıl etkiler?
... nasıl telafi isteyebilir?
4. Yapay zeka istemlerinizi yazma
- Aşağıdaki istemlere göre birkaç yapay zeka istemi yaz:
- Yalnızca paydaşlarınızı değil, Veri Kartınızı okuduktan sonra yanıtlanmasını isteyeceklerini düşündüğünüz bazı ilk soruları da nasıl ele aldığınıza dikkat edin. Bu, veri kartınıza eklemeniz gereken son soru grubuna bir adım daha yaklaştığınız anlamına gelir.
5. Optik
Perspektif, lens ve kapsam terimlerinin yapay zeka görüntülerini çerçevelemek için kullanıldığını fark etmiş olabilirsiniz. Bu terimler daha önce tanımlanmış olsa da aslında optik olarak adlandırdığımız bir kılavuz metaforunun parçasıdır. Bu soruları, temsilcilerinizin veri kümenizi nasıl anlayabileceğini düşünmenize yardımcı olmak için oluşturduk.
Kapsamlar
Optikte, dürbünler malzemeleri tespit etmek, gözlemlemek, büyütmek, yansıtmak ve hatta test etmek için lensler ve aynalar kullanır. Veri kümeleri bağlamında bu metafor, açık, açık olmayan, görünür ve görünmez yönleri ortaya çıkarmak için sorulara odaklanıp bunları çerçevelemeniz açısından harika bir örnektir.
Buna kapsamlar diyoruz. Kapsamlar, veri kümelerini anlamak için art arda bir dizi soru sormanın bir yoludur. Farklı ayrıntı düzeylerindeki kapsamları birleştirerek, temsilcilerinizin şeffaflık raporları aracılığıyla veri kümeleri hakkında tutarlı bir anlayış oluşturmasına yardımcı olacak içerikler oluşturabilirsiniz.
Aşağıdaki tabloda, çerçevemizdeki üç kapsam türü, açıklamaları, örnekleri ve her birinin amacı yer almaktadır:
Kapsam | Açıklama | Örnek | Purpose |
Teleskopik | Birden fazla veri kümesinde sıkça bulunan özelliklerle ilgili sorular. Özellikleri etiketler. | Bu veri kümesi, kimliği tanımlayabilecek bilgiler (PII) içeriyor mu? | Temsilcilerinizin Veri Kartınızda veya şeffaflık yapıtınızda gezinmesine yardımcı olacak ek bilgileri tanıtın ve bağlamını belirleyin. |
Periskopik | Üreticinin veri kümesine özgü özelliklerle ilgili sorular. Gözlemleri tanımlar. | Kaç özellikte PII var? | Genellikle veri kümesinin şekli ve boyutu gibi operasyonel bilgilerin veya kaynaklar ya da amaçlar gibi işlevsel bilgilerin sağlanması için ayrılır. |
Mikroskobik | Veri kümelerinin kararlar, süreçler ve etkiler gibi gözlemlenemeyen yönleriyle ilgili sorular. Açıklama isterler. | Bu veri kümesinde kimliği tanımlayabilecek bilgiler nasıl anonimleştirildi? | Kararlarla ilgili ayrıntılı açıklamalar isteyin veya ilgili periskopik ve teleskopik sorulara verilen yanıtları yöneten daha uzun süreç belgelerini özetleyin. |
Veri kartı oluşturma süreciniz boyunca bu üç kapsam türünü göz önünde bulundurmanız önemlidir. Yalnızca teleskop içeren bir veri kartı, veri kümenizle ilgili yalnızca bariz bilgileri açıklar ve herhangi bir farklı değer eklemez. Yalnızca periskopların yer aldığı bir veri kartı, bağlam, alaka düzeyi veya önem hakkında ayrıntı vermeden aşırı teknik olabilir. Yalnızca mikroskopların bulunduğu bir veri kartı, temsilcilerin ayrıntılarda kolayca kaybolmasına ve büyük resmi gözden kaçırmasına neden olabilir.
Bu nedenle, bir veri kartının yorumlanması, bu kapsam düzeylerinin varlığından veya yokluğundan büyük ölçüde etkilenir. Bu sorular, temsilcilerin ve yapımcıların riski değerlendirmesine, azaltma planları yapmasına ve uygun olduğu durumlarda daha iyi veri kümesi oluşturma fırsatlarını belirlemesine olanak tanır. Teleskoplar, periskoplar ve mikroskoplar birlikte, çok sayıda paydaşın veri kartınızda yönünü kaybetmeden ve kaybolmadan gezinmesini sağlayacak faydalı ayrıntılar sunar.
Örnek
Aracı bilgi yolculukları (AIJ'ler) bölümünde, veri bilimcisi için olan da dahil olmak üzere bazı AIJ örnekleri gördünüz. Bu örneği yakından incelerseniz aşağıdaki sorular da dahil olmak üzere bazı soruları kapsamlarına göre gruplandırabileceğinizi görebilirsiniz:
Veri bilimci olarak veri kümesinin yapısını öğrenmek istiyorum. Bu nedenle, aşağıdaki soruyu soruyorum:
Telescopic
... veri biçimi nedir?
... veri kümesinin modalitesi nedir?
Periscopic
... veri kümesinde kaç özellik var?
... kaç özellik tasarlanmıştır?
Mikroskobik (Microscopic)
... hangi özellikler arasında güçlü bir korelasyon var?
... yapıda bağımlılıklar varsa?
Muhtemelen, temsilcilerinizi düşünerek teleskopik, periskopik ve mikroskobik sorular sormuşsunuzdur.
6. Kapsamlarla AIJ'lerinizi yeniden yapılandırın
- Kapsamlarla yapay zeka işlerini yeniden yapılandırmak için aşağıdaki örnek istemi kullanın:
7. Tebrikler
Tebrikler! Veri kartı oluşturmaya başladıysanız Artık sorularınızı değerlendirmeye hazırsınız.