Тенденція злиття AI+Web3: Обчислювальна потужність даних Децентралізація стає фокусом

AI+Web3: Вежі та площі

ТЛ; ДОКТОР

  1. Проекти Web3 з концепцією штучного інтелекту стали об'єктами залучення інвестицій на первинному та вторинному ринках.

  2. Можливості Web3 в сфері ШІ виявляються в: використанні розподілених стимулів для координації потенційних постачань у довгому хвості, між даними, зберіганням і обчисленнями; одночасно створюючи відкриту модель та децентралізований ринок AI-агентів.

  3. Основні сфери застосування штучного інтелекту в індустрії Web3 - це фінанси на блокчейні ( криптоплатежі, торгівля, аналіз даних ) та допомога в розробці.

  4. Ефективність AI+Web3 проявляється в їхній взаємодоповнювальності: Web3 має потенціал протистояти централізації AI, а AI може допомогти Web3 вийти за межі.

! AI+Web3: Вежі та Плази

Вступ

Останні два роки розвиток ШІ наче натиснули на кнопку прискорення; цей ефект метелика, спричинений Chatgpt, не лише відкрив новий світ генеративного штучного інтелекту, але й викликав хвилю в Web3 на іншому березі.

Під впливом концепції AI, фінансування на ринку криптовалют, що сповільнюється, помітно підвищилося. Лише за перше півріччя 2024 року 64 проекти Web3+AI завершили фінансування, при цьому операційна система на основі штучного інтелекту Zyber365 досягла максимального обсягу фінансування в 100 мільйонів доларів у рамках раунду A.

Ринок другорядних активів стає все більш процвітаючим. Дані з криптоагрегаторів свідчать, що всього за рік загальна капіталізація AI-сектора досягла 48,5 мільярда доларів, а обсяг торгів за 24 години наблизився до 8,6 мільярда доларів. Явні переваги, які виникають внаслідок прогресу основних AI-технологій, стали помітними: після випуску моделі OpenAI Sora для перетворення тексту на відео середня ціна в AI-секторі зросла на 151%. Ефект AI також поширився на один з секторів криптовалют, що залучають капітал, - Meme: перший концепт AI Agent MemeCoin ------ GOAT швидко здобув популярність і отримав оцінку в 1,4 мільярда доларів, успішно запустивши бум AI Meme.

Дослідження та теми про AI+Web3 також набирають популярності, від AI+Depin до AI Memecoin, а потім до нинішніх AI Agent та AI DAO, емоція FOMO вже не встигає за швидкістю зміни нових наративів.

AI+Web3, ця комбінація термінів, наповнена гарячими грошима, перспективами та майбутніми ілюзіями, неминуче сприймається як шлюб, укладений капіталом. Нам, здається, важко розрізнити під цією розкішною мантією, чи це справді майданчик спекулянтів, чи переддень вибуху світанку?

Щоб відповісти на це питання, важливо розглянути ключове міркування для обох сторін: чи стане краще, якщо ми будемо разом? Чи можемо ми отримати вигоду з моделей один одного? У цій статті ми також намагаємось поглянути на цю структуру з перспективи попередників: як Web3 може відігравати роль на всіх етапах технологічного стеку AI, і що AI може принести нове для Web3?

Ч.1 Які можливості має Web3 під стеком ШІ?

Перед тим, як розгорнути цю тему, нам потрібно зрозуміти технологічний стек великих моделей ШІ:

Викладіть увесь процес простішими словами: «Велика модель» подібна до людського мозку, на початковому етапі цей мозок належить немовляті, яке тільки що з'явилося на світ, і йому потрібно спостерігати та споживати величезну кількість інформації з навколишнього середовища, щоб зрозуміти цей світ, це етап «збирання» даних; оскільки комп'ютери не мають таких сенсорів, як людське зір чи слух, перед навчанням масштабну не марковану інформацію з зовнішнього світу потрібно перетворити за допомогою «попередньої обробки» в інформаційний формат, зрозумілий і придатний для комп'ютера.

Вводячи дані, AI за допомогою «навчання» створює модель, яка має здатність розуміти та прогнозувати, що можна порівняти з процесом, коли немовля поступово розуміє та вивчає навколишній світ. Параметри моделі подібні до мовних навичок немовляти, які постійно коригуються в процесі навчання. Коли вміст навчання починає розділятися на спеціалізації або отримується зворотний зв'язок під час спілкування з людьми та вносяться корективи, починається етап «долоні» великої моделі.

Діти, поступово дорослішаючи і навчаючись говорити, можуть розуміти сенс у нових розмовах і висловлювати свої почуття та думки. Ця стадія схожа на «інференцію» великих моделей штучного інтелекту, де модель здатна прогнозувати та аналізувати нові мовні та текстові дані. Немовлята через мовні навички висловлюють почуття, описують об'єкти та вирішують різноманітні проблеми, що також схоже на те, як великі моделі штучного інтелекту застосовуються на етапі інференції до різних специфічних завдань після завершення навчання, таких як класифікація зображень, розпізнавання мови тощо.

А AI Agent наближається до наступної форми великої моделі — здатної самостійно виконувати завдання та досягати складних цілей, що не лише має здатність до мислення, але також може запам'ятовувати, планувати і використовувати інструменти для взаємодії з світом.

На даний момент, щодо проблем штучного інтелекту в різних стекових рішеннях, Web3 наразі попередньо сформував багаторівневу, взаємопов'язану екосистему, що охоплює всі етапи процесу роботи з AI моделями.

! AI+Web3: Вежі та Квадрати

Один. Базовий рівень: обчислювальна потужність та дані Airbnb

Потужність

На сьогодні одним із найвищих витрат для штучного інтелекту є обчислювальна потужність та енергія, необхідні для навчання моделей і їхнього використання.

Прикладом є те, що LLAMA3 від Meta потребує 16000 графічних процесорів H100, вироблених NVIDIA(, які є провідними графічними процесорами, спеціально розробленими для штучного інтелекту та робочих навантажень з високою продуктивністю. )Навчання займає 30 днів. Ціна на 80GB версію коливається в межах від 30,000 до 40,000 доларів, що потребує інвестицій у комп'ютерне обладнання від 400 до 700 мільйонів доларів(GPU+ мережеві чіпи), при цьому щомісячне навчання вимагає споживання 1.6 мільярда кіловат-годин, а витрати на енергію щомісяця становлять близько 20 мільйонів доларів.

Розвантаження обчислювальної потужності AI є саме тією областю, де Web3 вперше перетинається з AI ------ DePin( децентралізовані фізичні інфраструктурні мережі) на даний момент, один з веб-сайтів даних вже представив понад 1400 проектів, серед яких проекти обміну потужністю GPU включають io.net, Aethir, Akash, Render Network та ін.

Основна логіка полягає в тому, що платформа дозволяє особам або організаціям, які мають невикористані ресурси GPU, вносити свій обчислювальний потенціал в децентралізований спосіб без необхідності отримувати дозвіл. Це підвищує використання невикористаних ресурсів GPU через онлайн-ринок, схожий на Uber або Airbnb, що дозволяє кінцевим користувачам отримувати більш дешеві та ефективні обчислювальні ресурси; одночасно механізм стейкінгу також забезпечує покарання для постачальників ресурсів у разі порушення механізмів контролю якості або переривання мережі.

Його особливістю є:

  • Збір бездіяльних ресурсів GPU: постачальниками в основному є незалежні треті сторони, такі як малі та середні дата-центри, оператори криптовалютних шахт та інші, які мають надлишкові обчислювальні ресурси, а також апаратне забезпечення для добування з механізмом консенсусу PoS, наприклад, майнери FileCoin та ETH. Наразі також є проекти, що прагнуть запустити обладнання з нижчими бар'єрами входу, такі як exolab, яке використовує локальні пристрої, такі як MacBook, iPhone, iPad тощо, для створення обчислювальної мережі для виконання великих моделей.

  • В умовах довгого хвоста ринку обчислювальної потужності штучного інтелекту:

a. «З технічної точки зору» децентралізований ринок обчислювальної потужності більше підходить для етапів висновків. Навчання більше залежить від обробної здатності даних, яку забезпечують гігантські кластери GPU, тоді як висновки вимагають від GPU відносно нижчої обчислювальної потужності, наприклад, Aethir зосереджується на рендерингу з низькою затримкою та AI-висновкових додатках.

b. "З точки зору попиту" малі та середні споживачі обчислювальних потужностей не будуть окремо навчати свої великі моделі, а лише виберуть оптимізацію та доопрацювання навколо небагатьох провідних великих моделей, і ці сценарії природно підходять для розподілених невикористаних обчислювальних ресурсів.

  • Децентралізоване володіння: технічне значення блокчейну полягає в тому, що власники ресурсів завжди зберігають контроль над своїми ресурсами, гнучко коригуючи їх відповідно до попиту, одночасно отримуючи прибуток.

Дані

Дані є основою штучного інтелекту. Якщо немає даних, обчислення є безглуздим, як водорості на поверхні, а зв'язок між даними та моделлю подібний до відомої приказки "Сміття на вході, сміття на виході"; кількість даних і якість введення визначають остаточну якість виходу моделі. Що стосується навчання сучасних AI-моделей, дані визначають мовні здібності моделі, її здатність до розуміння, а також світогляд і гуманістичні прояви. На сьогоднішній день труднощі у потребах AI у даних в основному зосереджені на чотирьох аспектах:

  • Голод даних: Тренування AI-моделей залежить від великої кількості вхідних даних. Відкриті дані показують, що OpenAI тренує GPT-4 з параметрами на рівні трильйонів.

  • Якість даних: з розвитком AI та інтеграцією в різні галузі, своєчасність даних, різноманітність даних, спеціалізація вертикальних даних, а також нові джерела даних, такі як емоції в соціальних медіа, ставлять нові вимоги до їх якості.

  • Проблеми конфіденційності та відповідності: наразі різні країни та компанії поступово усвідомлюють важливість якісних наборів даних і починають накладати обмеження на збори даних.

  • Витрати на обробку даних великі: обсяг даних великий, процес обробки складний. Відкриті дані показують, що більше 30% витрат на НДР компаній ШІ йдуть на збір та обробку базових даних.

Наразі рішення web3 проявляються в наступних чотирьох аспектах:

  1. Збір даних: можливість безкоштовно надавати зібрані дані з реального світу швидко вичерпується, витрати компаній на дані зростають щороку. Але водночас ці витрати не повертаються до справжніх постачальників даних, платформи повністю користуються цінністю, яку створюють дані, наприклад, одна платформа отримала доходів на загальну суму 203 мільйони доларів США, підписавши угоду з AI-компанією про ліцензування даних.

Дозволити справжнім користувачам також брати участь у створенні вартості, яку приносить дані, а також отримувати більш приватні та цінні дані від користувачів низькими витратами через розподілену мережу та механізми стимулювання є баченням Web3.

  • Grass є децентралізованим рівнем даних і мережею, користувачі можуть запускати вузли Grass, вносити вільну пропускну здатність і реле трафіку для збору в реальному часі даних з усього Інтернету та отримувати винагороду у токенах;

  • Vana впроваджує унікальний концепт пулу ліквідності даних (DLP), де користувачі можуть завантажувати свої приватні дані (, такі як записи покупок, звички перегляду, активність у соціальних мережах тощо ), та гнучко обирати, чи надавати ці дані для використання конкретним третім сторонам;

  • У PublicAI користувачі можуть використовувати #AI或#Web3 як категорію на X і @PublicAI для збору даних.

  1. Попередня обробка даних: під час обробки даних AI, оскільки зібрані дані зазвичай є шумними і містять помилки, їх потрібно очистити та перетворити у придатний формат перед навчанням моделі, що включає стандартизацію, фільтрацію та обробку пропущених значень. Цей етап є одним із небагатьох ручних етапів у галузі AI, що призвело до виникнення професії аналітиків даних. Оскільки вимоги моделей до якості даних зростають, поріг входження для аналітиків даних також підвищується, а це завдання природним чином підходить для децентралізованих механізмів стимулювання Web3.
  • Наразі Grass та OpenLayer обидва розглядають можливість приєднатися до цього ключового етапу позначення даних.

  • Synesis запропонував концепцію «Train2earn», акцентуючи увагу на якості даних, користувачі можуть отримувати винагороду за надання анотованих даних, коментарів або інших форм внеску.

  • Проект позначення даних Sapien ігровим способом виконує завдання маркування, дозволяючи користувачам ставити на заставу бали для отримання більшої кількості балів.

  1. Конфіденційність та безпека даних: потрібно чітко розрізняти, що конфіденційність даних та безпека є двома різними поняттями. Конфіденційність даних стосується обробки чутливих даних, у той час як безпека даних захищає інформацію від несанкціонованого доступу, знищення та крадіжки. Отже, переваги технологій конфіденційності Web3 та потенційні сценарії застосування проявляються в двох аспектах: (1) навчання чутливих даних; (2) співпраця з даними: кілька власників даних можуть спільно брати участь у навчанні ШІ без необхідності ділитися своїми оригінальними даними.

Актуальні технології конфіденційності в Web3 включають:

  • Довіра виконуване середовище ( TEE ), наприклад, Super Protocol;

  • Повна гомоморфна криптація (FHE), наприклад, BasedAI, Fhenix.io або Inco Network;

  • Технологія нульового знання (zk), така як Reclaim Protocol, використовує технологію zkTLS для генерації доказів нульового знання для HTTPS-трафіку, що дозволяє користувачам безпечно імпортувати активність, репутацію та дані ідентифікації з зовнішніх сайтів, не розкриваючи чутливу інформацію.

Проте, наразі ця сфера все ще перебуває на ранній стадії, більшість проектів все ще в процесі дослідження, поточна проблема полягає в занадто високих витратах на обчислення, деякі приклади:

  • Фреймворк zkML EZKL потребує приблизно 80 хвилин для генерації доказу моделі 1M-nanoGPT.

  • За даними Modulus Labs, витрати на zkML перевищують витрати на чисті обчислення більше ніж у 1000 разів.

  1. Зберігання даних: Після отримання даних, також необхідно місце для зберігання даних на ланцюгу, а також LLM, створеного з цих даних. Основною проблемою є доступність даних (DA): до оновлення Danksharding в Ethereum, його пропускна здатність становила 0,08 МБ. Тим часом, навчання AI-моделей та реальний розрахунок зазвичай потребують пропускної здатності даних від 50 до 100 ГБ за секунду. Така різниця в масштабах робить існуючі рішення на ланцюгу недостатніми при зустрічі з
Переглянути оригінал
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Нагородити
  • 6
  • Поділіться
Прокоментувати
0/400
TokenomicsTinfoilHatvip
· 10год тому
Обертання без краю, напевно.
Переглянути оригіналвідповісти на0
DataBartendervip
· 10год тому
Знову малюють BTC.
Переглянути оригіналвідповісти на0
0xSherlockvip
· 10год тому
Мара… всі готують концепції
Переглянути оригіналвідповісти на0
PhantomMinervip
· 10год тому
Знову малюють пироги, хто це прийме?
Переглянути оригіналвідповісти на0
LiquidatedTwicevip
· 10год тому
О, блін, це ж просто шаблонна спекуляція?
Переглянути оригіналвідповісти на0
MetaverseMigrantvip
· 10год тому
Ще одна хвиля пастки для залучення грошей прийшла
Переглянути оригіналвідповісти на0
  • Закріпити