Yapay Zeka Modelleri ve Telif Hakkı İhlalleri: Büyük Dil Modellerini Eğitmek Ne Kadar Etiğe Uygun?
Modern teknolojinin hızla gelişen alanlarından biri olan büyük dil modelleri (LLM), doğal dil işleme ve anlamada çığır açıyor. Ancak, bu modellerin eğitiminde kullanılan veri setlerinin kaynağı ve telif hakları, etik ve yasal soruları gündeme getiriyor.
Meta ve LibGen İddiaları
Meta CEO’su Mark Zuckerberg’in, şirketin Llama yapay zeka modelleri ekibine korsan e-kitaplar ve makaleler içeren bir veri seti kullanma izni verdiği iddia ediliyor. LibGen adlı bu veri seti, telif hakkıyla korunan eserleri yayınlamasıyla tanınıyor. Davacılar, Meta çalışanlarının LibGen’in korsan bir veri seti olduğunun farkında olduğunu ve bunun şirketin konumunu zayıflatabileceğini öne sürüyor.
Meta’nın Savunması
Meta, ABD’nin adil kullanım doktrini kapsamında, telif hakkıyla korunan eserleri dönüştürücü bir şekilde yeni bir şey oluşturmak için kullanabileceğini savunuyor.
İç Yazışmalar
Meta’nın iç yazışmaları, veri setini kullanmak için Zuckerberg’in onayını aldığını gösteriyor. Ayrıca, Meta’nın olası ihlalleri gizlemek için telif hakkı bilgilerini kaldırdığı iddia ediliyor. Mühendislerin veri setinden telif hakkı ve kaynak bilgilerini sildiği belirtiliyor.
Torrentleme İddiaları
Meta’nın LibGen’i torrentleyerek başka bir telif hakkı ihlaline karıştığı da iddia ediliyor. Torrentleme, dosyaların web üzerinde dağıtılmasını sağlar. Meta’nın baş mühendisinin torrentleme konusundaki endişeleri görmezden geldiği öne sürülüyor.
Meta’nın Llama Modeli
Meta’nın LLAMA modeli, doğal dil işleme, metin üretimi, çeviri ve özetleme gibi dil tabanlı görevlerde kullanılan bir yapay zeka modelidir. Meta, modeli yapay zeka araştırmaları ve pratik uygulamalarda yenilikçi çözümler sunmak için geliştirdiğini belirtiyor.