Veri, varlıktır: DataFi yeni bir mavi okyanus açıyor.

Yazar: Biteye çekirdek katkıda bulunan @anci_hu49074

"En iyi temel modelleri oluşturmak için küresel rekabetin olduğu bir çağdayız. Hesaplama gücü ve model mimarisi önemlidir, ancak gerçek hendek eğitim verisidir."

—Sandeep Chinchali, Baş AI Sorumlusu, Story

Ölçek AI perspektifinden AI Veri takibinin potansiyelini konuşalım.

Bu ay AI çevresindeki en büyük dedikodu, Meta'nın para gücünü göstermesi. Zuckerberg, her yerde yetenekler topladı ve esasen Çinli bilimsel araştırma yeteneklerinden oluşan lüks bir Meta AI ekibi kurdu. Ekip lideri Alexander Wang , yalnızca 28 yaşında ve Scale AI'yi kurdu. Scale AI'yi kurdu ve şu anda 29 milyar ABD doları değerinde. Hizmet verdikleri müşteriler arasında ABD askeri, OpenAI, Anthropic, Meta ve diğer rakip AI devleri bulunuyor; bunların hepsi Scale AI tarafından sağlanan veri hizmetlerine bağımlı. Scale AI'nin ana işi, büyük miktarda doğru etiketlenmiş veri sağlamaktır.

Scale AI neden bir grup unicorn arasından öne çıkabiliyor?

Sebebi, AI endüstrisinde verinin önemini erken fark etmesidir.

Hesaplama gücü, modeller ve veriler, AI modellerinin üç temel direğidir. Büyük model bir insana benzetilirse, o zaman model beden, hesaplama gücü yiyecek ve veri bilgi/bilgidir.

LLM'nin yükselişinden bu yana geçen yıllarda, sektörün gelişim odak noktası da modellerden hesaplama gücüne kaymıştır. Bugün, çoğu model, model çerçevesi olarak transformer'ları benimsemiştir ve bazen MoE veya MoRe gibi yenilikler ortaya çıkmaktadır. Büyük devler ya kendi Süper Küme'lerini inşa ederek hesaplama gücü Büyük Duvarı'nı tamamlamakta ya da AWS gibi güçlü bulut hizmetleri ile uzun vadeli anlaşmalar imzalamaktadır. Temel hesaplama gücü sağlandığında, verinin önemi giderek belirgin hale gelmiştir.

Veri bir varlıktır: DataFi yeni bir mavi okyanus açıyor

Geleneksel To B büyük veri şirketleri, Palantir gibi ikincil piyasada öne çıkan bir üne sahipken, Scale AI isminin de belirttiği gibi, AI modelleri için sağlam bir veri temeli oluşturmaya kendini adamıştır. İş modeli sadece mevcut verileri madencilik yapmayla sınırlı değildir, aynı zamanda daha uzun vadeli veri üretim işine de odaklanmaktadır. Ayrıca, farklı alanlarda yapay uzmanlar aracılığıyla bir AI eğitmeni ekibi kurmaya çalışarak AI model eğitimi için daha kaliteli eğitim verileri sağlamayı hedeflemektedir.

Eğer bu işletme ile aynı fikirde değilseniz, modelin nasıl eğitildiğine bir göz atalım.

Modelin eğitimi iki kısma ayrılır - ön eğitim ve ince ayar.

Ön eğitim kısmı, insan bebeklerinin konuşmayı yavaş yavaş öğrenme sürecine biraz benziyor. Genellikle ihtiyacımız olan, AI modeline çevrimiçi tarayıcılardan elde edilen büyük miktarda metin, kod ve diğer bilgileri beslemektir. Model, bu içerikleri kendisi öğrenir, insan dili olarak adlandırılan ( doğal dili ) konuşmayı öğrenir ve temel iletişim becerilerine sahip olur.

İnce ayar kısmı, genellikle doğru ve yanlış, yanıtlar ve yönler olan okula gitmek gibidir. Okullar, öğrencileri kendi konumlarına göre farklı yetenekler kazanacak şekilde eğitir. Biz de modelin beklenen yeteneklere sahip olması için bazı önceden işlenmiş ve hedeflenmiş veri setlerini kullanarak eğiteceğiz.

Veri bir varlıktır: DataFi yeni bir mavi okyanus açıyor

Bu noktada, ihtiyaç duyduğumuz verilerin de iki parçaya ayrıldığını anlamış olabilirsiniz.

  • Bazı verilerin fazla işlenmesine gerek yoktur, yeteri kadar işlenmesi genellikle Reddit, Twitter, Github gibi büyük UGC platformlarının tarayıcı verilerinden, kamu literatür veri tabanlarından, kurumsal özel veri tabanlarından vb. gelir.
  • Diğer kısım, profesyonel ders kitapları gibi, modelin belirli mükemmel niteliklerinin geliştirilebilmesi için dikkatli tasarım ve tarama gerektirir. Bu, veri temizleme, tarama, etiketleme ve manuel geri bildirim gibi bazı gerekli çalışmaları gerçekleştirmemizi gerektirir.

Bu iki veri seti, AI Veri alanının ana gövdesini oluşturmaktadır. Bu görünüşte düşük teknolojiye sahip veri setlerini küçümsemeyin. Mevcut ana görüş, Ölçeklenebilirlik yasalarındaki hesaplama gücü avantajının yavaş yavaş etkisiz hale gelmesiyle birlikte, verilerin farklı büyük model üreticilerinin rekabet avantajlarını sürdürmeleri için en önemli sütun haline geleceğidir.

Model yetenekleri geliştikçe, daha sofistike ve profesyonel eğitim verileri model yeteneklerinin anahtar etki eden değişkenleri haline gelecektir. Eğer model eğitimini dövüş sanatları ustalarının yetiştirilmesi ile karşılaştırırsak, yüksek kaliteli veri setleri en iyi dövüş sanatı sırlarıdır. Bu metaforu tamamlamak için, hesaplama gücünün panzehir olduğunu ve modelin kendisinin yeterlilik olduğunu da söyleyebiliriz.

Dikey bir perspektiften bakıldığında, AI Verisi de yığılma yeteneğine sahip uzun vadeli bir alandır. Önceki çalışmaların birikimi ile veri varlıkları da bileşen olma yeteneğine sahip olacak ve yaşlandıkça daha popüler hale gelecektir.

( Web3 DataFi: AI Verisi için Seçilen Bereketli Toprak

Filipinler, Venezuela ve diğer yerlerdeki yüz binlerce kişiden oluşan Scale AI'nin uzaktan manuel etiketleme ekibi ile karşılaştırıldığında, Web3'nün AI verileri alanında doğal bir avantajı vardır ve yeni terim DataFi doğmuştur.

İdeal olarak, Web3 DataFi'nin avantajları şunlardır:

  1. Akıllı sözleşmelerle garanti edilen veri egemenliği, güvenliği ve gizliliği

Mevcut kamu verilerinin geliştirilmeye ve tüketilmeye yaklaşmakta olduğu bir aşamada, açıklanmamış verilerin, hatta özel verilerin nasıl daha fazla madenciliği yapılacağı, veri kaynaklarını elde etme ve genişletme için önemli bir yönüdür. Bu, önemli bir güven seçim sorunu ile karşı karşıyadır - merkezi bir büyük şirketin sözleşme satın alma sistemini mi seçersiniz ve verilerinizi mi satarsınız; yoksa blok zinciri yöntemini mi seçersiniz, verilerin IP'sini elinizde tutmaya devam eder misiniz ve akıllı sözleşmeler aracılığıyla: verilerinizi kim, ne zaman ve hangi amaçla kullandığını açıkça anlayabilir misiniz?

Aynı zamanda, hassas bilgiler için, özel verilerinizin yalnızca ağzını kapalı tutan ve sızdırmayan makineler tarafından işlenmesini sağlamak için zk, TEE ve diğer yöntemleri kullanabilirsiniz.

  1. Doğal coğrafi arbitraj avantajı: en uygun iş gücünü çekmek için ücretsiz dağıtılmış mimari

Belki de geleneksel iş gücü üretim ilişkisini sorgulama zamanıdır. Scale AI gibi dünyanın dört bir yanında ucuz iş gücü aramak yerine, blok zincirinin dağıtık özelliklerinden yararlanmak ve dünya genelinde dağılmış iş gücünün, akıllı sözleşmeler tarafından garanti edilen açık ve şeffaf teşvikler aracılığıyla veri katkısına katılmasını sağlamak daha iyidir.

Veri etiketleme ve model değerlendirme gibi emek yoğun görevler için Web3 DataFi kullanımı, veri fabrikaları kurmanın merkezi yaklaşımına göre katılımcıların çeşitliliği açısından daha elverişlidir ve bu aynı zamanda veri önyargısını önlemede uzun vadeli bir öneme sahiptir.

  1. Blok zincirinin net teşvik ve uzlaşma avantajları

"Jiangnan Deri Fabrikası" trajedisinden nasıl kaçınmalıyız? Elbette, akıllı sözleşmelerde net fiyat etiketleriyle birlikte teşvik sistemini kullanarak insan doğasının karanlığını değiştirmeliyiz.

Kaçınılmaz deglobalizasyon bağlamında, düşük maliyetli coğrafi arbitrajı nasıl devam ettirebiliriz? Dünyanın dört bir yanında şirketler açmak açıkça daha zor hale geliyor, o halde neden eski dünyanın engellerini aşmayalım ve on-chain (blokzincir) uzlaşma yöntemini benimsemeyelim?

  1. Daha verimli ve açık bir "tek durak" veri piyasası inşa etmeye yardımcı olur.

"Fiyat farkından kar elde eden aracılar" hem arz hem de talep tarafları için sürekli bir acıdır. Merkezi bir veri şirketinin aracılık etmesine izin vermek yerine, arz ve talep taraflarının daha şeffaf ve verimli bir şekilde bağlantı kurabilmesi için Taobao gibi açık bir pazar üzerinden zincir üzerinde bir platform oluşturmak daha iyidir.

On-chain AI ekosisteminin gelişmesiyle birlikte, on-chain verilerine olan talep daha canlı, segmentli ve çeşitli hale gelecektir. Sadece merkeziyetsiz bir pazar bu talebi verimli bir şekilde sindirip ekolojik refah haline dönüştürebilir.

)# Perakende yatırımcılar için, DataFi, sıradan perakende yatırımcıların katılımını en çok teşvik eden en merkeziyetsiz AI projesidir.

AI araçlarının ortaya çıkması öğrenme eşiklerini bir ölçüde düşürse de, merkeziyetsiz AI'nin asıl amacı, devlerin AI işindeki mevcut tekelini kırmaktır; ancak, mevcut birçok projenin teknik geçmişi olmayan perakende yatırımcılar için çok erişilebilir olmadığını kabul etmek gerekir - merkeziyetsiz hesaplama ağı madenciliğine katılmak genellikle pahalı başlangıç donanım yatırımı ile birlikte gelir ve model pazarının teknik eşiği her zaman sıradan katılımcıları kolayca caydırabilir.

Buna karşılık, bu, sıradan kullanıcıların AI devriminde yakalayabileceği birkaç fırsattan biridir. Web3, çeşitli basit görevleri tamamlayarak buna katılmanıza olanak tanır; bunlar arasında veri sağlama, insan beyninin sezgi ve içgüdüsüne dayalı olarak modelleri etiketleme ve değerlendirme veya daha ileri giderek bazı basit yaratımlar yapmak için AI araçlarını kullanma, veri işlemlerine katılma vb. Mao Partisi'nin eski sürücüleri için zorluk değeri temelde sıfırdır.

Web3 DataFi'nin potansiyel projeleri

Paranın aktığı yerde yön vardır. Scale AI'nın Meta'dan 14.3 milyar dolarlık yatırım almasının ve Palantir'in hisse fiyatının Web2 dünyasında bir yılda 5 katından fazla artmasının yanı sıra, DataFi de Web3 finansmanında oldukça iyi performans gösterdi. Burada bu projelere kısaca bir giriş yapıyoruz.

![Veri bir varlıktır: DataFi yeni bir mavi okyanus açıyor]###https://img-cdn.gateio.im/webp-social/moments-c629c990916b7e1fbd4699663c3cbcff.webp###

(# Sahara AI, @SaharaLabsAI, 49 milyon dolar topladı

Sahara AI'nın nihai hedefi, merkeziyetsiz bir AI süper altyapısı ve ticaret piyasası oluşturmaktır. Test edilecek ilk sektör AI Verisi olacaktır. )Data Services Platform###'in halka açık beta sürümü 22 Temmuz'da piyasaya sürülecektir. Kullanıcılar, veri katkısında bulunarak, veri etiketleme ve diğer görevlerde yer alarak token ödülleri kazanabilirler.

Bağlantı: app.saharaai.com

(# Evet, @yupp_ai, 33 milyon dolar topladı

Yupp, kullanıcı geri bildirimlerini model çıktıları üzerinde toplayan bir AI model geri bildirim platformudur. Mevcut ana görev, kullanıcıların aynı istem için farklı modellerin çıktısını karşılaştırabilmeleri ve daha iyi olduğunu düşündükleri çıktıyı seçmeleridir. Görevi tamamlamak, Yupp puanları kazandırır ve bu puanlar daha sonra USDC gibi fiat stabilcoin'lerle değiştirilebilir.

Bağlantı:

)# Vana, @vana, 23 milyon dolar topladı

Vana, kullanıcıların sosyal medya etkinlikleri, gezinme geçmişi gibi kişisel verilerini ###monetize edilebilir dijital varlıklara dönüştürmeye odaklanmaktadır. Kullanıcılar, kişisel verilerini ilgili veri likidite havuzu ###DLP('na yüklemek için yetki verebilirler. Bu veriler havuzlanacak ve AI model eğitimi gibi görevlerde kullanılacak, kullanıcılar da karşılık gelen token ödülleri alacaklardır.

Bağlantı:

)# Chainbase, @ChainbaseHQ, 16.5 milyon dolar topladı

Chainbase'in iş modeli, zincir üzerindeki verilere odaklanmakta ve şu anda 200'den fazla blockchain'i kapsamakta, zincir üzerindeki etkinlikleri yapılandırılmış, doğrulanabilir ve para kazanılabilir veri varlıklarına dönüştürerek dApp geliştirmeye yardımcı olmaktadır. Chainbase'in iş modeli, esasen çok zincirli indeksleme ve diğer yöntemler aracılığıyla elde edilmektedir ve veriler, Manuscript sistemi ve Theia AI modeli aracılığıyla işlenmektedir. Şu anda sıradan kullanıcılar çok fazla dahil olmamaktadır.

(# Sapien, @JoinSapien, 15.5 milyon dolar topladı

Sapien, insan bilgisini yüksek kaliteli AI eğitim verisine büyük ölçekte dönüştürmeyi hedefliyor. Herkes platformda veri etiketleme yapabilir ve veri kalitesini akran doğrulaması ile sağlayabilir. Aynı zamanda, kullanıcılar daha fazla ödül kazanmak için uzun vadeli itibar oluşturmaya veya staking aracılığıyla taahhütlerde bulunmaya teşvik edilmektedir.

Bağlantı:

)# Prisma X, @PrismaXai , 11 milyon dolar topladı

Prisma X, fiziksel veri toplamanın anahtar olduğu robotlar için açık bir koordinasyon katmanı olmak istiyor. Bu proje şu anda erken aşamalarındadır. Yeni yayımlanan beyaz bültene göre, katılım robotlara yatırım yaparak veri toplama, robot verilerini uzaktan işletme vb. içerebilir. Şu anda beyaz bültene dayalı bir quiz açıktır ve puan kazanmak için katılabilirsiniz.

Bağlantı:

Masa, @getmasafi, 8.9 milyon dolar topladı

Masa, Bittensor ekosistemindeki önde gelen alt ağ projelerinden biridir ve şu anda Veri Alt Ağı No. 42 ve Ajan Alt Ağı No. 59'u işletmektedir. Veri alt ağı, veriye gerçek zamanlı erişim sağlamaya kendini adamıştır. Şu anda, madenciler esasen TEE donanımı aracılığıyla X/Twitter'da gerçek zamanlı verileri taramaktadır. Sıradan kullanıcılar için katılımın zorluğu ve maliyeti oldukça yüksektir.

Irys, @irys_xyz, 8.7 milyon $ topladı

Irys, programlanabilir veri depolama ve hesaplama üzerine odaklanarak, AI, merkeziyetsiz uygulamalar ###dApps### ve diğer veri yoğun uygulamalar için verimli ve düşük maliyetli çözümler sunmayı amaçlamaktadır. Veri katkısı açısından, sıradan kullanıcılar şu anda pek fazla katılamazken, mevcut test ağında katılmak için birden fazla etkinlik bulunmaktadır.

Bağlantı:

ORO, @getoro_xyz, 6 milyon dolar topladı

ORO'nun yapmak istediği, sıradan insanları AI katkısına katılmaya güçlendirmektir. Destek yöntemleri şunları içerir: 1. Kişisel verileri katkıda bulunmak için kişisel hesabınızı bağlayın, sosyal hesaplar, sağlık verileri, e-ticaret ve finansal hesaplar dahil; 2. Veri görevlerini tamamlayın. Test ağı şimdi çevrimiçi ve katılabilirsiniz.

Bağlantı: app.getoro.xyz

(# Gata, @Gata_xyz, 4 milyon dolar topladı

Gata, merkeziyetsiz bir veri katmanı olarak konumlanmış olup, katılmak için üç ana ürüne sahiptir: 1. Veri Ajanı: Kullanıcının web sayfasını açmasıyla otomatik olarak çalışan ve verileri işleyen bir dizi AI Ajanı; 2. AII-in-one Sohbet: Yupp'un model değerlendirmesine benzer bir mekanizma ile ödül kazanma; 3. GPT-to-Earn: Kullanıcıların ChatGPT üzerindeki konuşma verilerini toplayan bir tarayıcı eklentisi.

Bağlantı:

)# Bu mevcut projelere nasıl bakıyorsunuz?

Şu anda bu projelere giriş engelleri genellikle yüksek değildir, ancak kullanıcılar ve ekosistem bağlılığı biriktirildiğinde, platform avantajlarının hızla birikeceği kabul edilmelidir. Bu nedenle, erken aşamalarda çabaların teşvikler ve kullanıcı deneyimi üzerinde yoğunlaşması gerekir. Yeterince kullanıcı çekmeden büyük veri işinin yapılması mümkün değildir.

Ancak, iş gücü yoğun projeler olarak, bu veri platformları iş gücünü nasıl yöneteceklerini ve iş gücünü çekerken veri çıktısının kalitesini nasıl sağlayacaklarını da düşünmelidir. Sonuçta, birçok Web3 projesinin ortak bir sorunu, platformdaki çoğu kullanıcının acımasız kar hırsıyla hareket etmesidir. Genellikle kısa vadeli faydalar uğruna kaliteden ödün verirler. Eğer platformun ana kullanıcıları olmalarına izin verilirse, kötü para kaçınılmaz olarak iyi parayı dışlayacak ve nihayetinde veri kalitesi garanti edilemeyecek ve alıcılar çekilemeyecektir. Şu anda, Sahara ve Sapien gibi projelerin veri kalitesine vurgu yaptığını ve platformdaki iş gücüyle uzun vadeli ve sağlıklı bir işbirliği ilişkisi kurmaya çabaladığını gördük.

Ayrıca, şeffaflık eksikliği, mevcut on-chain projelerin bir diğer sorunudur. Gerçekten de, blok zincirinin imkansız üçgeni birçok projeyi başlangıç aşamasında "merkezileşme, merkezsizleşmeyi yönlendirir" yolunu almaya zorlamıştır. Ancak artık daha fazla on-chain proje, insanlara "Web3 görünümündeki eski Web2 projeleri" izlenimini veriyor - zincirde izlenebilecek çok az kamu verisi var ve hatta yol haritası, açıklık ve şeffaflık konusundaki uzun vadeli kararlılığı görmekte zorlanıyor. Bu, şüphesiz Web3 DataFi'nin uzun vadeli sağlıklı gelişimi için toksiktir ve daha fazla projenin her zaman orijinal niyetlerini korumasını ve açıklık ve şeffaflık hızını artırmasını umuyoruz.

Son olarak, DataFi'nin kitlesel benimseme yolu da iki parçaya ayrılmalıdır: biri, ağa katılmak için yeterince toC katılımcısını çekmek, veri toplama/üretim mühendisliği için yeni bir güç oluşturmak ve AI ekonomisinin tüketicileriyle ekolojik bir kapalı döngü kurmak; diğeri ise mevcut ana akım B2B şirketlerinden tanınma kazanmaktır. Sonuçta, kısa vadede, derin cepleriyle büyük veri siparişlerinin ana kaynağıdırlar. Bu bağlamda, Sahara AI, Vana vb. gibi şirketlerin iyi ilerleme kaydettiğini de gördük.

Sonuç

Daha fatalist olmak gerekirse, DataFi, insan zekasını uzun vadede makine zekasını geliştirmek için kullanmakla ilgilidir ve akıllı sözleşmeleri, insan zekası iş gücünün karlı olmasını sağlamak ve nihayetinde makine zekasından geri bildirim elde etmek için bir sözleşme olarak kullanır.

Eğer AI çağının belirsizliği hakkında endişeleriniz varsa ve kripto para dünyasının dalgalanmaları arasında hala blok zinciri ideallerine sahipseniz, o zaman bir grup sermaye devinin izinden gidip DataFi'ye katılmak, trende ayak uydurmak için iyi bir seçimdir.

View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Reward
  • Comment
  • Share
Comment
0/400
No comments
Trade Crypto Anywhere Anytime
qrCode
Scan to download Gate app
Community
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)