Reuters’in yeni bir raporu, sözleşmeli çalışanların Yapay Zeka (YZ) sistemleri için etiketlemek amacıyla Facebook ve Instagram‘daki özel yayınlara baktıklarını ortaya koyuyor. Birçok teknoloji şirketi gibi, Facebook da içeriği platformda sıralamak için makine öğrenmesini ve YZ kullanıyor. Ancak, bunu yapabilmek için, farklı içerik türlerini tanımlaması ve yazılımın eğitilmesi gerekir. Bu algoritmaları eğitmek için, her biri insanlar tarafından kategorize edilmesi ve etiketlenmesi gereken – “veri ek açıklaması” olarak bilinen bir işlem olan örnek verileri analiz etmeleri gerekir.

Reuters’in raporu, beş kategoriye göre gönderilere açıklama eklemek için 260 çalışanı istihdam eden Hintli dış kaynak şirketi WiPro’ya odaklanıyor. WiPro‘daki çalışanlar, durum güncellemeleri, videolar, fotoğraflar, paylaşılan bağlantılar ve Hikayeler dahil olmak üzere Facebook ve Instagram‘dan bir dizi içeriği sıralamak zorundalar. Her bir içerik parçası doğruluk için iki işçi tarafından kontrol edilir ve işçiler her gün yaklaşık 700 öğe ekliyor.

Facebook, Reuters’e WiPro’nun çalışanları tarafından incelenen içeriğin belirli sayıda arkadaşla paylaşılan özel gönderiler içerdiğini ve verilerin bazen kullanıcıların adlarını ve diğer hassas bilgileri içerdiğini doğruladı. Facebook, dünya genelinde toplamda binlerce kişiyi istihdam eden 200 tane içerik etiketleme projesine sahip olduğunu söylüyor.

YZ’nin ürün yönetimi direktörü Nipun Mathur, Reuters’e verdiği demeçte. “İhtiyacınız olanın temel bir parçası” diyor “İhtiyacın ortadan kalktığını görmüyorum”. Bu tür veri ek açıklama projeleri, yapay zeka geliştirmenin anahtarıdır ve insan emeğinin daha ucuz olduğu ülkelere dış kaynaklardan sağlanan çağrı merkezi çalışması gibi bir parça haline gelmiştir.

Örneğin Çin’de, devasa insan daireleri, bisikletlileri ve yayaları nasıl tanımlayabileceklerini eğitmek için kendi kendini süren arabalardan gelen görüntüleri etiketler. Çoğu internet kullanıcısı bu tür işleri bilmeden bile gerçekleştirmiştir. Google’ın, insan olduğunuzu kanıtlamak için resimlerdeki nesneleri tanımlamanızı isteyen CAPTCHA sistemi, bilgileri sayısallaştırmak ve YZ’yi eğitmek için kullanılır.

Bu tür bir çalışma gereklidir, ancak söz konusu veriler özel olduğunda rahatsız edicidir. Son araştırmalar, çalışanların Amazon Echo cihazları ve Ring güvenlik kameraları tarafından toplanan hassas bilgileri nasıl etiketlediklerini vurguladı. Alexa  ile konuştuğunda, başka birinin konuşmanı dinleyeceğini düşünmüyorsun, ama bu tam olarak ne olabilir.

İş, büyük teknoloji şirketlerinden daha düşük güvenlik ve gizlilik standartlarına sahip olabilecek şirketlere dış kaynak tedarik edildiğinde sorun daha da rahatsız edicidir. Facebook, yasal ve gizlilik ekiplerinin tüm veri etiketleme çabalarını onayladığını söyledi ve şirket Reuters’e son zamanlarda “gizlilik beklentilerinin takip edildiğinden ve parametrelerin beklendiği gibi çalıştığından emin olmak için” bir denetim sistemi getirdiğini söyledi.

Bununla birlikte, şirket Avrupa Birliğinin GDPR düzenlemelerini ihlal ediyor olabilir ve bu da şirketlerin kişisel verileri nasıl toplayabilecekleri ve kullanabilecekleri konusunda katı sınırlar koymuş olabilir. Facebook, insan işçiler tarafından etiketlenen verilerin bir dizi makine öğrenme sistemini eğitmek için kullanıldığını söylüyor. Bunlar, şirketin Marketplace alışveriş özelliğinde içerik önerme; Görme engelli kullanıcılar için fotoğraf ve videoları tanımlamak; ve yayınları sıralama, böylece belirli reklamlar siyasi veya yetişkinlere yönelik içeriğin yanında görünmez.