AI'nin Mühendislik Devrimi: Transformer'dan Yüz Model Savaşına
Geçen ay, AI dünyasında bir "hayvan savaşı" patlak verdi. Bir taraf, Meta'nın piyasaya sürdüğü Llama serisi modelleri, açık kaynak özellikleri sayesinde geliştiriciler tarafından büyük ilgi görüyor. Diğer taraf ise Birleşik Arap Emirlikleri'ndeki Teknoloji İnovasyon Araştırma Enstitüsü tarafından geliştirilen Falcon adlı büyük model. Bu iki model, açık kaynak LLM sıralamasında sırayla üst sıralara çıkıyor.
İlginçtir ki, BAE'nin AI yarışmasına katılma hedefi "ana oyuncuları devirmek". Kısa bir süre sonra, BAE'nin yapay zeka bakanı, Time dergisinin "AI alanının en etkili 100 kişisi" listesine alındı.
Artık AI alanı "birçok kişinin rekabet ettiği" bir aşamaya girdi. Birçok ülke ve şirket kendi büyük dil modellerini geliştirmeye çalışıyor. Sadece Körfez bölgesinde, birden fazla oyuncunun bu işe girdiği görülüyor. Bu durum, bazı sektörden kişilerin duygularını dile getirmesine neden oldu ve sert teknoloji alanında bile "birçok model savaşı" durumu ortaya çıktığını düşündürdü.
Transformer Dünyayı Yutuyor
Mevcut büyük modelin hızlı gelişimi, 2017'de yayımlanan "Attention Is All You Need" makalesine borçludur. Bu makalede önerilen Transformer algoritması, bu AI dalgasının katalizörü olmuştur.
Transformer'dan önce, "makinelere kitap okuma öğretmek" kabul görmüş bir akademik zorluktu. Erken dönem sinir ağları bağlamı anlamakta zorlanıyordu. 2014 yılında, döngüsel sinir ağları (RNN) belirli bir ölçüde bu sorunu çözmüştü, ancak sıralı hesaplama özellikleri büyük ölçekli verileri işleme yeteneğini sınırladı.
Transformer, konum kodlama ve paralel hesaplama gibi yeniliklerle hem eğitim verimliliğini artırmış hem de bağlamı anlama yeteneğini güçlendirmiştir. Bu, AI'nın teorik araştırmalardan mühendislik pratiğine geçişini sağlamış ve büyük model çağının yolunu açmıştır.
Transformer'ın yaygınlaşmasıyla birlikte, temel algoritma yeniliklerinin hızı yavaşladı ve veri mühendisliği, hesaplama gücü gibi mühendislik unsurları AI yarışında kritik hale geldi. Bu durum, belirli bir teknik yeterliliğe sahip olan şirketlerin büyük modeller geliştirmeyi denemelerine olanak tanıdı.
Cam Üzerine İnşa Edilmiş Savunma Seddesi
Şu anda, "Bai Mo Savaşı" gerçek oldu. Yapılan haberlere göre, bu yılın Temmuz ayı itibarıyla, Çin'deki büyük model sayısı 130'a ulaşmış, bu da ABD'nin 114 modelini geçmiştir. Çin ve ABD dışında, Japonya, Hindistan, Güney Kore gibi ülkeler de yerel büyük modellerini piyasaya sürmüştür.
Ancak, giriş kolaylığı herkesin AI çağının devlerinden biri olabileceği anlamına gelmez. Falcon ve Llama'nın rekabetini ele alacak olursak, Falcon bazı sıralamalarda önde olsa da, Meta'ya ne kadar büyük bir etki yarattığını söylemek zor. Açık kaynak büyük modeller için, aktif bir geliştirici topluluğu temel rekabet gücüdür. Meta, sosyal medya genleri ve açık kaynak stratejisi sayesinde bu alanda avantaj sağlamaktadır.
Ayrıca, çoğu büyük modelin performansı hala GPT-4 ile belirgin bir fark var. Son AgentBench testinde, GPT-4 4.41 puanla önde giderken, ikinci sıradaki Claude yalnızca 2.77 puan aldı ve çoğu açık kaynak modelin puanı yalnızca 1 civarındaydı.
Bu fark, üst düzey AI şirketlerinin sahip olduğu yüksek kalitede bilim insanı ekiplerinden ve uzun süreli birikimden kaynaklanmaktadır. Bu nedenle, büyük modellerin temel rekabet gücü, ekosistem inşasında ( açık kaynak yolu ) veya saf akıl yürütme yeteneğinde ( kapalı kaynak yolu ) olabilir.
Değerin Temeli
AI heyecanı tüm hızıyla devam etse de, şu anda bu alandan kâr elde edebilen şirket sayısı pek fazla değil. Yüksek hesaplama maliyetleri, sektörün gelişimi için büyük bir engel teşkil ediyor. Tahminlere göre, dünya genelindeki teknoloji şirketleri her yıl büyük model altyapısına 200 milyar dolar harcarken, büyük modellerin sağladığı gelir en fazla 75 milyar dolar, bu da büyük bir açığın olduğunu gösteriyor.
Microsoft ve Adobe gibi sektörün önde gelen şirketleri bile yapay zeka hizmetlerinin fiyatlandırılması ve maliyet kontrolüyle ilgili zorluklarla karşı karşıya. Çoğu parametre ölçeği büyük olan büyük modeller için en önemli uygulama senaryoları hâlâ sohbet işlevinde kalmaktadır.
Eşitlenmiş rekabetin artması ve açık kaynak modellerinin yaygınlaşmasıyla birlikte, yalnızca büyük model hizmetleri sunmaya dayalı ticari model daha büyük bir baskı ile karşılaşabilir. Gelecekte, AI teknolojisinin gerçek değeri muhtemelen daha fazla somut uygulama senaryolarında ve gerçek sorunları çözme yeteneğinde ortaya çıkacaktır.
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
10 Likes
Reward
10
5
Share
Comment
0/400
JustHereForAirdrops
· 15h ago
Sonunda her yerini berbat ettim.
View OriginalReply0
SerumSquirter
· 15h ago
Para yakma savaşı, kimde daha çok para varsa o kazanır.
View OriginalReply0
WhaleStalker
· 15h ago
Yatırımcılar savaşıyor, bireysel yatırımcılar zor durumda.
View OriginalReply0
GasDevourer
· 15h ago
Kim Bilgi İşlem Gücü maliyetini aşabilir ki?
View OriginalReply0
ZenMiner
· 15h ago
Para yakma savaşları gerçekten iyi oynanıyor, zenginler gerçekten iyi oynuyor.
AI büyük model rekabeti yükseliyor: Transformer'dan yüz model savaşına mühendislik devrimi
AI'nin Mühendislik Devrimi: Transformer'dan Yüz Model Savaşına
Geçen ay, AI dünyasında bir "hayvan savaşı" patlak verdi. Bir taraf, Meta'nın piyasaya sürdüğü Llama serisi modelleri, açık kaynak özellikleri sayesinde geliştiriciler tarafından büyük ilgi görüyor. Diğer taraf ise Birleşik Arap Emirlikleri'ndeki Teknoloji İnovasyon Araştırma Enstitüsü tarafından geliştirilen Falcon adlı büyük model. Bu iki model, açık kaynak LLM sıralamasında sırayla üst sıralara çıkıyor.
İlginçtir ki, BAE'nin AI yarışmasına katılma hedefi "ana oyuncuları devirmek". Kısa bir süre sonra, BAE'nin yapay zeka bakanı, Time dergisinin "AI alanının en etkili 100 kişisi" listesine alındı.
Artık AI alanı "birçok kişinin rekabet ettiği" bir aşamaya girdi. Birçok ülke ve şirket kendi büyük dil modellerini geliştirmeye çalışıyor. Sadece Körfez bölgesinde, birden fazla oyuncunun bu işe girdiği görülüyor. Bu durum, bazı sektörden kişilerin duygularını dile getirmesine neden oldu ve sert teknoloji alanında bile "birçok model savaşı" durumu ortaya çıktığını düşündürdü.
Transformer Dünyayı Yutuyor
Mevcut büyük modelin hızlı gelişimi, 2017'de yayımlanan "Attention Is All You Need" makalesine borçludur. Bu makalede önerilen Transformer algoritması, bu AI dalgasının katalizörü olmuştur.
Transformer'dan önce, "makinelere kitap okuma öğretmek" kabul görmüş bir akademik zorluktu. Erken dönem sinir ağları bağlamı anlamakta zorlanıyordu. 2014 yılında, döngüsel sinir ağları (RNN) belirli bir ölçüde bu sorunu çözmüştü, ancak sıralı hesaplama özellikleri büyük ölçekli verileri işleme yeteneğini sınırladı.
Transformer, konum kodlama ve paralel hesaplama gibi yeniliklerle hem eğitim verimliliğini artırmış hem de bağlamı anlama yeteneğini güçlendirmiştir. Bu, AI'nın teorik araştırmalardan mühendislik pratiğine geçişini sağlamış ve büyük model çağının yolunu açmıştır.
Transformer'ın yaygınlaşmasıyla birlikte, temel algoritma yeniliklerinin hızı yavaşladı ve veri mühendisliği, hesaplama gücü gibi mühendislik unsurları AI yarışında kritik hale geldi. Bu durum, belirli bir teknik yeterliliğe sahip olan şirketlerin büyük modeller geliştirmeyi denemelerine olanak tanıdı.
Cam Üzerine İnşa Edilmiş Savunma Seddesi
Şu anda, "Bai Mo Savaşı" gerçek oldu. Yapılan haberlere göre, bu yılın Temmuz ayı itibarıyla, Çin'deki büyük model sayısı 130'a ulaşmış, bu da ABD'nin 114 modelini geçmiştir. Çin ve ABD dışında, Japonya, Hindistan, Güney Kore gibi ülkeler de yerel büyük modellerini piyasaya sürmüştür.
Ancak, giriş kolaylığı herkesin AI çağının devlerinden biri olabileceği anlamına gelmez. Falcon ve Llama'nın rekabetini ele alacak olursak, Falcon bazı sıralamalarda önde olsa da, Meta'ya ne kadar büyük bir etki yarattığını söylemek zor. Açık kaynak büyük modeller için, aktif bir geliştirici topluluğu temel rekabet gücüdür. Meta, sosyal medya genleri ve açık kaynak stratejisi sayesinde bu alanda avantaj sağlamaktadır.
Ayrıca, çoğu büyük modelin performansı hala GPT-4 ile belirgin bir fark var. Son AgentBench testinde, GPT-4 4.41 puanla önde giderken, ikinci sıradaki Claude yalnızca 2.77 puan aldı ve çoğu açık kaynak modelin puanı yalnızca 1 civarındaydı.
Bu fark, üst düzey AI şirketlerinin sahip olduğu yüksek kalitede bilim insanı ekiplerinden ve uzun süreli birikimden kaynaklanmaktadır. Bu nedenle, büyük modellerin temel rekabet gücü, ekosistem inşasında ( açık kaynak yolu ) veya saf akıl yürütme yeteneğinde ( kapalı kaynak yolu ) olabilir.
Değerin Temeli
AI heyecanı tüm hızıyla devam etse de, şu anda bu alandan kâr elde edebilen şirket sayısı pek fazla değil. Yüksek hesaplama maliyetleri, sektörün gelişimi için büyük bir engel teşkil ediyor. Tahminlere göre, dünya genelindeki teknoloji şirketleri her yıl büyük model altyapısına 200 milyar dolar harcarken, büyük modellerin sağladığı gelir en fazla 75 milyar dolar, bu da büyük bir açığın olduğunu gösteriyor.
Microsoft ve Adobe gibi sektörün önde gelen şirketleri bile yapay zeka hizmetlerinin fiyatlandırılması ve maliyet kontrolüyle ilgili zorluklarla karşı karşıya. Çoğu parametre ölçeği büyük olan büyük modeller için en önemli uygulama senaryoları hâlâ sohbet işlevinde kalmaktadır.
Eşitlenmiş rekabetin artması ve açık kaynak modellerinin yaygınlaşmasıyla birlikte, yalnızca büyük model hizmetleri sunmaya dayalı ticari model daha büyük bir baskı ile karşılaşabilir. Gelecekte, AI teknolojisinin gerçek değeri muhtemelen daha fazla somut uygulama senaryolarında ve gerçek sorunları çözme yeteneğinde ortaya çıkacaktır.