YellowSnowman
Member
Her zamankinden daha önemli olan AI modellerini beslemek için, şirketler internette “açık web” de maksimum bilgileri hasat etmekten sorumlu bir robot ordusu kullandılar. Wikipedia, ücretsiz ve yeniden kullanılabilir içeriği (koşullar altında) önemli bir hedeftir, ancak bu koleksiyon büyük ölçüde çevrimiçi ansiklopedinin altyapılarına ağırdır. Herkesi tatmin etmek için bir çözüm uygulanmıştır.
Wikimedia, barındıran ve destekleyen kar amacı gütmeyen vakıf Wikipediayapay zeka şirketlerinden veri hasatçıları ile mücadele ediyor. Bunlar çok açgözlü ve kuruluşun altyapısına baskı yapıyor. Aslında, yılın başından bu yana, bu robotların aktivitesi multimedya içeriğini indirmek için kullanılan bant genişliğinin % 50 artmıştır.
Wikipedia'dan geçmek yerine hizmet etmeyi seçiyor
Sunucularını rahatlatmak için Wikimedia şimdi İngilizce ve Fransızca Wikipedia makalelerinin bir veritabanı sunuyor. Bu yapılandırılmış taban, otomatik öğrenme kullanımları için özel olarak tasarlanmıştır: modelleme, ince ayar, hizalama ve hatta analiz gibi görevler için hemen sömürülebilir olan zaten tedavi edilmiş öğelere erişimi kolaylaştırır.
Teknik olarak, veritabanı, makineler tarafından okunabilen bir JSON formatında veri sağlayan Anlık Görüntü Yapılandırılmış İçerik API'sını kullanır. Bu, geliştiricilerin ve araştırmacıların özetler, kısa açıklamalar, Infobox türünün yapılandırılmış verileri, görüntülere bağlantılar ve açıkça tanımlanmış makalelerin bölümleri (referanslar veya metin olmayan öğeler hariç) içeren iyi bölümlü makalelerle doğrudan çalışmasına olanak tanır.
Bu veriler ücretsiz lisanslar, kamu malı veya alternatif lisanslar altında belirli durumlar altında yayınlanmaktadır. Makine öğrenimi topluluğu için Google tarafından düzenlenen referans platformu Kaggle tarafından barındırılıyor. Wikimedia, içeriğini paylaşmak için Google ile zaten bir ortaklığa sahipti. Bu yeni girişim bu nedenle mantıklı devam.
Wikimedia
Wikimedia, barındıran ve destekleyen kar amacı gütmeyen vakıf Wikipediayapay zeka şirketlerinden veri hasatçıları ile mücadele ediyor. Bunlar çok açgözlü ve kuruluşun altyapısına baskı yapıyor. Aslında, yılın başından bu yana, bu robotların aktivitesi multimedya içeriğini indirmek için kullanılan bant genişliğinin % 50 artmıştır.
Wikipedia'dan geçmek yerine hizmet etmeyi seçiyor
Sunucularını rahatlatmak için Wikimedia şimdi İngilizce ve Fransızca Wikipedia makalelerinin bir veritabanı sunuyor. Bu yapılandırılmış taban, otomatik öğrenme kullanımları için özel olarak tasarlanmıştır: modelleme, ince ayar, hizalama ve hatta analiz gibi görevler için hemen sömürülebilir olan zaten tedavi edilmiş öğelere erişimi kolaylaştırır.
Teknik olarak, veritabanı, makineler tarafından okunabilen bir JSON formatında veri sağlayan Anlık Görüntü Yapılandırılmış İçerik API'sını kullanır. Bu, geliştiricilerin ve araştırmacıların özetler, kısa açıklamalar, Infobox türünün yapılandırılmış verileri, görüntülere bağlantılar ve açıkça tanımlanmış makalelerin bölümleri (referanslar veya metin olmayan öğeler hariç) içeren iyi bölümlü makalelerle doğrudan çalışmasına olanak tanır.
Bu veriler ücretsiz lisanslar, kamu malı veya alternatif lisanslar altında belirli durumlar altında yayınlanmaktadır. Makine öğrenimi topluluğu için Google tarafından düzenlenen referans platformu Kaggle tarafından barındırılıyor. Wikimedia, içeriğini paylaşmak için Google ile zaten bir ortaklığa sahipti. Bu yeni girişim bu nedenle mantıklı devam.
Kaynak :Herhangi bir 01net haberini kaçırmamak için bizi Google News ve WhatsApp'ta takip edin.![]()
Wikimedia