Anthropic'in izinsiz web sitesi içeriği topladığı iddia edildi

Amazon · 31 Tem 2024

ChatGPT rakibi Claude'u piyasaya süren Amerikan AI şirketi, üretken AI'ları eğitmek amacıyla içeriğinin toplanmasını yasaklayan bir web sitesinin kullanım koşullarına uymamakla suçlanıyor. Diğer iki site, Claude'un tarayıcısının önemli ölçüde “kazındığını” belirtiyor.

ChatGPT'nin rakiplerinden biri olan Claude'u geliştiren şirket olan Anthropic, platformların kullanım koşullarına saygı göstermeden, üretken AI'sını eğitmek için web sitelerini mutlu bir şekilde mi parçalıyor? iFixit adlı bir şirketin CEO'sunun “ en büyük onarım bilgi tabanı “çevrimiçi. Kyle Wiens, 24 Temmuz'da X hesabında, yeni kurulan şirketin tarayıcısı olan Claude'un web tarayıcısı robotunun sitesinin sunucularına saldırdığını iddia etti” 24 saatte bir milyon kez »: Genel kullanım koşullarını tamamen ihlal ederek yapılmış bir koleksiyon.

İkincisi aslında ” (Şirket Web Sitesi) üzerindeki herhangi bir içerik, materyal veya tasarım öğesinin makine öğrenimi veya yapay zeka modelinin eğitilmesi dahil olmak üzere herhangi bir başka amaçla çoğaltılması, kopyalanması veya dağıtılması, iFixit'in önceden açık yazılı izni olmaksızın kesinlikle yasaktır. “. Bu genel koşullar, bir web sitesinden veri toplanmasını ve daha sonra dil modellerini eğitmek için kullanılacak bir temel oluşturulmasını sağlayan içerik çıkarma işlemi olan “kazıma”yı (yani “kazıma” veya “kaldırma”) yasaklamaktadır.

Ayrıca okuyun: Telif Hakkı: Yaratıcılar ve sanatçılar ile yapay zeka geliştiricileri arasındaki savaşta neredeyiz?

“İçeriğimizi ödemeden alıyorsunuz, geliştirme kaynaklarımızı harekete geçiriyorsunuz”

“ Bu taleplerden herhangi biri hizmet şartlarımıza erişmiş olsaydı, içeriğimizin kullanımının açıkça yasak olduğunu size söylerdi. (…) iFixit CEO'su Kyle Wiens, X konusuna açıklık getirdi. İçeriğimizi ödemeden almıyorsunuz, geliştirme kaynaklarımızdan yararlanıyorsunuz. İçeriğimizi ticari kullanım için lisanslama hakkında bir görüşme yapmak istiyorsanız, buradayız “, ekledi.

iFixit, onarım kılavuzlarından forumlara ve soru-cevaplara kadar uzanan binlerce sayfa içeriyor: Claude'un büyük ölçüde yararlanacağı içerikler.Kazıma oranı o kadar yüksekti ki tüm alarmlarımızı çaldı ve geliştirme ekibimizi harekete geçirdi. “, Kyle Wiens meslektaşlarımıza açıkladı SınırBirkaç gün önce yayınlanan bir blog yazısında Anthropic, “ endüstri standartlarına göre, (Eski OpenAI yöneticileri tarafından kurulan San Francisco merkezli şirket, editörün notu) İnternette bulunan ve bir tarayıcı aracılığıyla toplanan genel veriler gibi çeşitli veri kaynaklarını model geliştirme için kullanır “. Ve ” Claude'un robotu tarafından taranmamak için robots.txt dosyasını değiştirmeniz gerekir. ” ve belirli bir uzantı ekleyin, şirket ekliyor. Bu tür dosyalar genellikle web tarayıcılarına hangi sayfalara erişebileceklerini ve erişemeyeceklerini söyler.

iFixit'in hemen eklediği bir uzantı. Çevrimiçi onarımlarda uzmanlaşmış şirket daha sonra bu uzantı yüklendikten sonra Anthropic tarayıcısının gerçekten durduğunu doğruladı. Startup'ın sözcüsü Jennifer Martinez, Sınırdaha sonra şirketin “saygı duyduğunu” açıkladı robots.txt dosyası. Tarayıcımız iFixit bunu uyguladığında bu sinyali dikkate aldı. “. Bu, bir web sitesinin kullanım şartlarının Anthropic'in robotunu durdurmak için yeterli olmadığı anlamına gelir. Bu üretken AI'nın “tarayıcılarını” açıkça engellemek, verilerinin Claude'un eğitim üslerine ulaşmasını önlemek için gereklidir.

Ayrıca okuyun: Anthropic, OpenAI ve Google'a karşı en iyi dil modelini iddia ediyor

Şartlar ve koşullarınızı değiştirmeniz etkisiz olacaktır.

iFixit vakası, Data Provenance Initiative tarafından yayınlanan ve “” olarak tanımlanan bir araştırmaya göre, hiç de istisnai bir durum değil. Veri şeffaflığı projelerine gönüllü olarak zaman ayıran bağımsız araştırmacılar ve akademisyenlerden oluşan bir kolektif “, birçok web sitesi, içeriklerinin toplanmasını açıkça yasaklamak için hizmet şartlarını (TOS) değiştirdi. Ancak bir web sitesi AI şirketine dava açmak istemediği sürece, bu pratik olarak etkisiz olacaktır.

Sordu 404MedyaÇalışmanın baş yazarı Shayne Longpre, yalnızca çok büyük platformların kendi Şartlar ve Koşullarına uyduğunu söyledi; dava açmış olabilecek olanlar. Ancak geri kalanlar AI şirketleri tarafından görmezden geliniyor, diye ekledi. Read the Docs ve Freelancer.com da CEO'larının X hakkındaki açıklamalarına göre Anthropic'in tarayıcısı tarafından önemli miktarda veri kazıma yapıldığını bildirdi. AI eğitimi için web'den içerik kazıma eylemi çok sayıda davaya yol açtı.

Ayrıca okuyun: New York Times tarafından saldırıya uğrayan OpenAI, gazetecilerin hazırlık belgelerine erişim talep ediyor

Yapay zeka şirketleri, “Web'i kullanma hakkına sahip olduklarına” inanırken, adil kullanım “Amerika Birleşik Devletleri'nde – telif hakkına ilişkin bir istisna – veya Avrupa'da arama hakkı (veri madenciliği), yayıncılar bunu telif haklarının ihlali – ve içeriklerinin “yağmalanması” olarak görüyorlar. Sorunu çözmek için yasal işlemler devam ediyor.

01net'ten hiçbir haberi kaçırmamak için bizi Google Haberler ve WhatsApp'tan takip edin.

Anthropic'in izinsiz web sitesi içeriği topladığı iddia edildi

Amazon

New member