La fusión de la IA y Web3: nuevas oportunidades para construir infraestructuras de IA distribuidas

AI+Web3: Torres y Plazas

TL;DR

  1. Los proyectos de Web3 con concepto de IA se han convertido en objetivos de atracción de capital en los mercados primario y secundario.

  2. Las oportunidades de Web3 en la industria de la IA se manifiestan en: el uso de incentivos distribuidos para coordinar el suministro potencial en la larga cola, a través de datos, almacenamiento y computación; al mismo tiempo que se establece un modelo de código abierto y un mercado descentralizado de agentes de IA.

  3. La IA se utiliza principalmente en la industria Web3 para finanzas en cadena (pagos en criptomonedas, transacciones, análisis de datos) y para ayudar en el desarrollo.

  4. La utilidad de AI+Web3 se refleja en la complementariedad de ambos: Web3 promete combatir la centralización de AI, y AI promete ayudar a Web3 a romper barreras.

AI+Web3:Torre y Plaza

Introducción

En los últimos dos años, el desarrollo de la IA ha sido como si se hubiera presionado un botón de aceleración. Las olas provocadas por Chatgpt no solo han abierto un nuevo mundo de inteligencia artificial generativa, sino que también han desencadenado un poderoso impulso en el ámbito de Web3.

Con el apoyo del concepto de IA, el financiamiento en el mercado de criptomonedas ha aumentado notablemente. Solo en la primera mitad de 2024, 64 proyectos Web3+IA completaron financiamiento, entre ellos, el sistema operativo basado en inteligencia artificial Zyber365, que logró un financiamiento máximo de 100 millones de dólares en la ronda A.

El mercado secundario es aún más próspero. Según los datos del sitio de agregación de criptomonedas Coingecko, en poco más de un año, la capitalización total del sector de IA ha alcanzado los 48,5 mil millones de dólares, y el volumen de transacciones en 24 horas se acerca a los 8,6 mil millones de dólares. Los avances en las tecnologías de IA han traído beneficios evidentes; tras el lanzamiento del modelo de OpenAI Sora que convierte texto en video, el precio promedio del sector de IA ha aumentado un 151%. El efecto de la IA también se ha extendido a uno de los sectores más atractivos de las criptomonedas: Meme. El primer MemeCoin basado en el concepto de AI Agent, GOAT, se ha vuelto popular rápidamente y ha alcanzado una valoración de 1.400 millones de dólares, provocando con éxito una fiebre de Memes de IA.

La investigación y los temas sobre AI+Web3 también están en auge, desde AI+Depin hasta AI Memecoin y actualmente AI Agent y AI DAO, la emoción de FOMO ya no puede seguir el ritmo de la rotación de nuevas narrativas.

AI+Web3, esta combinación de términos llena de dinero caliente, tendencias y fantasías futuras, inevitablemente es vista por algunos como un matrimonio arreglado por el capital. Parece que es difícil discernir, bajo esta lujosa vestimenta, si en realidad es el terreno de los especuladores o la víspera de una explosión del amanecer.

Para responder a esta pregunta, una reflexión clave para ambas partes es: ¿mejorará al tener a la otra parte? ¿Se puede beneficiar de los modelos de la otra parte? En este artículo, también intentamos examinar este patrón desde la perspectiva de quienes nos precedieron: ¿cómo puede Web3 desempeñar un papel en cada uno de los componentes de la pila tecnológica de IA, y qué nueva vitalidad puede traer la IA a Web3?

Parte 1 ¿Qué oportunidades hay para Web3 bajo la pila de IA?

Antes de abordar este tema, necesitamos comprender el stack tecnológico de los grandes modelos de IA:

Expresado en un lenguaje más sencillo, el proceso completo es el siguiente: un "gran modelo" es como el cerebro humano. En las primeras etapas, este cerebro pertenece a un bebé que acaba de llegar al mundo, que necesita observar e incorporar una gran cantidad de información del entorno para entender este mundo; esta es la fase de "recolección" de datos. Dado que las computadoras no poseen los sentidos humanos como la vista y el oído, antes del entrenamiento, la gran cantidad de información no etiquetada del exterior necesita ser convertida a través de "preprocesamiento" en un formato de información que la computadora pueda entender y utilizar.

Después de ingresar los datos, la IA construyó un modelo con capacidad de comprensión y predicción a través del "entrenamiento", lo que se puede ver como el proceso gradual de un bebé entendiendo y aprendiendo sobre el mundo exterior. Los parámetros del modelo son como la capacidad lingüística que el bebé ajusta continuamente durante el proceso de aprendizaje. Cuando el contenido aprendido comienza a especializarse, o cuando se comunica con otros y recibe retroalimentación y correcciones, entra en la fase de "ajuste fino" del gran modelo.

A medida que los niños crecen y aprenden a hablar, pueden entender el significado y expresar sus sentimientos e ideas en nuevas conversaciones. Esta etapa es similar a la "razonamiento" de los grandes modelos de IA, donde el modelo puede predecir y analizar nuevos inputs de lenguaje y texto. Los bebés expresan sus sentimientos, describen objetos y resuelven diversos problemas a través de su habilidad lingüística. Esto también es similar a cómo los grandes modelos de IA se aplican en la fase de razonamiento para diversas tareas específicas, como la clasificación de imágenes y el reconocimiento de voz, después de haber completado el entrenamiento y ser utilizados.

El Agente de IA se acerca más a la próxima forma de los grandes modelos: capaz de ejecutar tareas de forma independiente y perseguir objetivos complejos, no solo tiene la capacidad de pensar, sino que también puede recordar, planificar y utilizar herramientas para interactuar con el mundo.

Actualmente, en respuesta a los puntos críticos de la IA en diversas capas, Web3 ha comenzado a formar un ecosistema interconectado y multicapas que abarca todas las etapas del proceso de modelos de IA.

AI+Web3:Torres y Plazas

Uno, Capa básica: Airbnb de potencia de cálculo y datos

Potencia de cálculo

Actualmente, uno de los costos más altos de la IA es la potencia de cálculo y la energía necesarias para entrenar modelos y realizar inferencias.

Un ejemplo es que un gran modelo de lenguaje de una importante empresa de tecnología necesita 16,000 GPU de alto rendimiento producidas por un conocido fabricante de chips durante 30 días para completar el entrenamiento. El precio unitario de la versión de 80 GB de estas GPU oscila entre 30,000 y 40,000 dólares, lo que requiere una inversión en hardware de cálculo de entre 400 y 700 millones de dólares (GPU + chips de red), mientras que el entrenamiento mensual consume 1.6 mil millones de kilovatios-hora, con un gasto energético mensual de casi 20 millones de dólares.

La descompresión de la potencia de cálculo de IA es precisamente uno de los primeros campos donde Web3 se cruza con la IA: DePin (Red de Infraestructura Física Descentralizada). Actualmente, el sitio de datos DePin Ninja ha enumerado más de 1400 proyectos, entre los cuales los proyectos representativos de compartición de potencia de GPU incluyen io.net, Aethir, Akash, Render Network, entre otros.

Su lógica principal radica en que: la plataforma permite a individuos o entidades que poseen recursos GPU ociosos contribuir con su capacidad de cálculo de manera descentralizada y sin necesidad de permisos, a través de un mercado en línea similar a las plataformas de economía compartida entre compradores y vendedores, aumentando así la tasa de utilización de los recursos GPU que no se utilizan plenamente. Al mismo tiempo, el mecanismo de staking también asegura que, si se produce una violación del mecanismo de control de calidad o una interrupción de la red, los proveedores de recursos enfrenten las sanciones correspondientes.

Sus características son:

  • Reúne recursos de GPU ociosos: los proveedores son principalmente operadores de centros de datos independientes de mediana y pequeña escala, así como de granjas de minería de criptomonedas que tienen recursos de potencia de cálculo excedentes, con un mecanismo de consenso basado en PoS, como los mineros de FileCoin y ETH. Actualmente, también hay proyectos dedicados a iniciar dispositivos con un umbral más bajo, como exolab, que utiliza dispositivos locales como MacBook, iPhone, iPad, entre otros, para establecer una red de potencia de cálculo para la inferencia de grandes modelos.

  • Frente al mercado de larga cola de la potencia de cálculo de IA:

a. "Desde el punto de vista técnico", el mercado de potencia de cálculo descentralizada es más adecuado para los pasos de inferencia. El entrenamiento depende más de la capacidad de procesamiento de datos que ofrecen los GPUs a gran escala de clústeres, mientras que la inferencia requiere un rendimiento de cálculo de GPU relativamente bajo, como Aethir, que se centra en trabajos de renderizado de baja latencia y aplicaciones de inferencia de IA.

b. Desde el lado de la demanda, los demandantes de poder de cómputo medio no entrenarán por separado sus propios grandes modelos, sino que simplemente elegirán optimizar y ajustar finamente en torno a unos pocos grandes modelos destacados, y estos escenarios son naturalmente adecuados para los recursos de cómputo distribuidos ociosos.

  • Propiedad descentralizada: El significado técnico de la blockchain radica en que los propietarios de recursos siempre mantienen el control sobre sus recursos, ajustándolos de manera flexible según la demanda, mientras obtienen beneficios.

Datos

Los datos son la base de la IA. Sin datos, el cálculo es tan inútil como una hoja flotante en la superficie del agua, y la relación entre los datos y el modelo es como el dicho "Garbage in, Garbage out". La cantidad de datos y la calidad de la entrada determinan la calidad de la salida del modelo final. En el entrenamiento de los modelos de IA actuales, los datos determinan la capacidad lingüística del modelo, su capacidad de comprensión, e incluso sus valores y su comportamiento humanizado. Actualmente, las dificultades en la demanda de datos para la IA se centran principalmente en los siguientes cuatro aspectos:

  • Sed de datos: El entrenamiento de modelos de IA depende de grandes entradas de datos. Según información pública, una conocida empresa de IA ha entrenado su modelo de lenguaje de gran tamaño con una cantidad de parámetros que alcanza niveles de billones.

  • Calidad de los datos: Con la combinación de la IA y diversas industrias, la actualidad de los datos, la diversidad de los datos, la especialización de los datos verticales y la incorporación de nuevas fuentes de datos como las emociones en las redes sociales han planteado nuevos requisitos para su calidad.

  • Problemas de privacidad y cumplimiento: Actualmente, varios países y empresas están comenzando a notar la importancia de los conjuntos de datos de alta calidad y están imponiendo restricciones en la recopilación de conjuntos de datos.

  • Costos de procesamiento de datos elevados: gran volumen de datos y procesos complejos. Los documentos públicos muestran que más del 30% de los costos de I+D de las empresas de IA se destinan a la recopilación y procesamiento de datos básicos.

Actualmente, las soluciones de Web3 se manifiestan en los siguientes cuatro aspectos:

  1. Recolección de datos: La disponibilidad de datos del mundo real que pueden ser extraídos de forma gratuita se está agotando rápidamente, y el gasto de las empresas de IA en datos aumenta año tras año. Pero, al mismo tiempo, este gasto no se está redistribuyendo entre los verdaderos contribuyentes de datos; las plataformas disfrutan por completo del valor creado por los datos, como una plataforma social que generó ingresos totales de 203 millones de dólares a través de acuerdos de licencia de datos con empresas de IA.

La visión de Web3 es permitir que los usuarios que realmente contribuyen también participen en la creación de valor que generan los datos, así como obtener datos más privados y valiosos de los usuarios de manera económica a través de redes distribuidas y mecanismos de incentivos.

  • Grass es una capa de datos y red descentralizada, donde los usuarios pueden contribuir con ancho de banda ocioso y tráfico de retransmisión al ejecutar nodos de Grass para capturar datos en tiempo real de toda la Internet y recibir recompensas en tokens.

  • Vana introduce un concepto único de piscina de liquidez de datos (DLP), donde los usuarios pueden subir sus datos privados (como registros de compras, hábitos de navegación, actividades en redes sociales, etc.) a un DLP específico y elegir de manera flexible si autorizan a terceros específicos a utilizar esos datos.

  • En PublicAI, los usuarios pueden utilizar #AI或#Web3 como etiqueta de clasificación en una plataforma social y @PublicAI para llevar a cabo la recopilación de datos.

  1. Preprocesamiento de datos: En el proceso de manejo de datos de la IA, debido a que los datos recopilados suelen ser ruidosos y contener errores, deben ser limpiados y transformados a un formato utilizable antes de entrenar el modelo, lo que implica tareas repetitivas de estandarización, filtrado y manejo de valores perdidos. Esta etapa es uno de los pocos eslabones manuales en la industria de la IA, ha dado lugar a la profesión de etiquetador de datos, y a medida que las demandas de calidad de datos para los modelos aumentan, también lo hace el umbral para los etiquetadores de datos, y esta tarea es naturalmente adecuada para el mecanismo de incentivos descentralizados de Web3.
  • Actualmente, Grass y OpenLayer están considerando unirse a esta etapa clave de la anotación de datos.

  • Synesis propuso el concepto de "Train2earn", enfatizando la calidad de los datos, los usuarios pueden obtener recompensas al proporcionar datos anotados, comentarios u otras formas de entrada.

  • El proyecto de etiquetado de datos Sapien gamifica las tareas de etiquetado y permite a los usuarios apostar puntos para ganar más puntos.

  1. Privacidad y seguridad de los datos: Es importante aclarar que la privacidad de los datos y la seguridad de los datos son dos conceptos diferentes. La privacidad de los datos se refiere al manejo de datos sensibles, mientras que la seguridad de los datos protege la información de los datos contra el acceso no autorizado, la destrucción y el robo. Por lo tanto, las ventajas de la tecnología de privacidad de Web3 y los posibles escenarios de aplicación se reflejan en dos aspectos: (1) Entrenamiento de datos sensibles; (2) Colaboración de datos: Varios propietarios de datos pueden participar juntos en el entrenamiento de IA sin necesidad de compartir sus datos originales.

Las tecnologías de privacidad más comunes en Web3 incluyen:

  • Entorno de ejecución confiable ( TEE ), como Super Protocol.

  • Cifrado homomórfico completo (FHE), por ejemplo, BasedAI, Fhenix.io o Inco Network.

  • Tecnologías de conocimiento cero (zk), como Reclaim Protocol que utiliza la tecnología zkTLS, generan pruebas de conocimiento cero del tráfico HTTPS, lo que permite a los usuarios importar de forma segura datos de actividades, reputación e identidad desde sitios web externos sin exponer información sensible.

Sin embargo, actualmente este campo todavía se encuentra en una etapa temprana, la mayoría de los proyectos aún están en exploración, y un dilema actual es que el costo de computación es demasiado alto, algunos ejemplos son:

  • El marco zkML EZKL necesita aproximadamente 80 minutos para generar una prueba de un modelo 1M-nanoGPT.

  • Según los datos de Modulus Labs, el costo de zkML es más de 1000 veces mayor que el de la computación pura.

  1. Almacenamiento de datos: Una vez que se tiene los datos, también se necesita un lugar para almacenar los datos en la cadena, así como el LLM generado a partir de estos datos. Con la disponibilidad de datos (DA) como cuestión central, antes de la actualización de Danksharding en Ethereum, su capacidad era de 0.08MB. Al mismo tiempo, el entrenamiento de modelos de IA y la inferencia en tiempo real generalmente requieren un rendimiento de datos de 50 a 100GB por segundo. Esta diferencia de magnitud hace que las soluciones existentes en cadena se sientan impotentes frente a "aplicaciones de IA que consumen muchos recursos".
  • 0g.AI es un representante de esta categoría
Ver originales
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
  • Recompensa
  • 5
  • Compartir
Comentar
0/400
StablecoinEnjoyervip
· hace8h
No tengo fe en esta fusión
Ver originalesResponder0
ApeEscapeArtistvip
· 07-11 12:17
El futuro se ve prometedor
Ver originalesResponder0
LayerZeroHerovip
· 07-11 12:05
La complementariedad es la clave para ganar juntos.
Ver originalesResponder0
ShadowStakervip
· 07-11 12:00
Dirección que merece una investigación profunda
Ver originalesResponder0
NotGonnaMakeItvip
· 07-11 11:58
El futuro ya está aquí
Ver originalesResponder0
  • Anclado
Opere con criptomonedas en cualquier momento y lugar
qrCode
Escanee para descargar la aplicación Gate
Comunidad
Español
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)