Cuộc cách mạng trong lĩnh vực gán nhãn dữ liệu AI: Từ việc mua lại với giá trên trời đến đổi mới Web3
Gần đây, ngành AI đã dấy lên một làn sóng về việc gán nhãn dữ liệu. Một ông lớn mạng xã hội đã mua lại gần nửa cổ phần của một công ty gán nhãn dữ liệu với mức giá kinh ngạc là 14,8 tỷ USD, gây chấn động toàn bộ giới công nghệ. Trong khi đó, một dự án Web3 AI sắp ra mắt token vẫn đang nỗ lực thoát khỏi nhãn "thổi phồng khái niệm". Phía sau sự tương phản rõ rệt này, thị trường dường như đã bỏ qua một số yếu tố then chốt.
Dữ liệu ghi nhãn như một lĩnh vực, giá trị của nó có thể vượt quá việc tập hợp sức mạnh tính toán phân phối. Mặc dù câu chuyện về việc sử dụng GPU nhàn rỗi để thách thức các ông lớn trong ngành điện toán đám mây thật hấp dẫn, nhưng sức mạnh tính toán về bản chất là một hàng hóa tiêu chuẩn hóa, điểm khác biệt chính nằm ở giá cả và khả năng tiếp cận. Một khi các doanh nghiệp lớn điều chỉnh chiến lược, lợi thế này có thể nhanh chóng biến mất.
So với điều đó, gán nhãn dữ liệu là một lĩnh vực khác biệt cần trí tuệ và phán đoán chuyên môn của con người. Mỗi gán nhãn chất lượng cao đều chứa đựng kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, điều này không thể dễ dàng sao chép như sức mạnh tính toán của GPU. Ví dụ, một gán nhãn chẩn đoán hình ảnh ung thư chính xác cần trực giác chuyên môn của bác sĩ ung thư kỳ cựu, trong khi một phân tích cảm xúc thị trường tài chính sâu sắc thì không thể thiếu kinh nghiệm thực chiến của các nhà giao dịch có kinh nghiệm. Sự khan hiếm và tính không thể thay thế tự nhiên này đã xây dựng nên một bức tường thành vững chắc cho ngành gán nhãn dữ liệu.
Một ông lớn trong lĩnh vực mạng xã hội gần đây đã công bố việc mua lại 49% cổ phần của một công ty gán nhãn dữ liệu với giá 14,8 tỷ USD, đây là khoản đầu tư lớn nhất trong lĩnh vực AI năm nay. Điều đáng chú ý hơn là người sáng lập và Giám đốc điều hành của công ty gán nhãn dữ liệu này sẽ đồng thời phụ trách "phòng thí nghiệm nghiên cứu siêu thông minh" mới thành lập của công ty mạng xã hội này.
Doanh nhân 25 tuổi này đã thành lập công ty vào năm 2016 khi còn là một sinh viên bỏ học, và hiện tại công ty mà anh quản lý đã đạt giá trị 30 tỷ USD. Danh sách khách hàng của công ty bao gồm nhiều doanh nghiệp AI nổi tiếng, nhà sản xuất ô tô, gã khổng lồ công nghệ và các cơ quan chính phủ. Công ty chuyên cung cấp dịch vụ gán nhãn dữ liệu chất lượng cao cho việc đào tạo mô hình AI, với hơn 300.000 nhân viên gán nhãn đã được đào tạo chuyên nghiệp.
Thương vụ mua lại này đã tiết lộ một sự thật bị bỏ qua: ở giai đoạn phát triển AI hiện tại, sức mạnh tính toán không còn là tài nguyên khan hiếm, cấu trúc mô hình cũng có xu hướng đồng nhất, điều thực sự quyết định giới hạn trí tuệ nhân tạo là những dữ liệu đã được xử lý một cách cẩn thận. Công ty truyền thông xã hội này không chỉ mua lại một công ty gia công với giá cao, mà đang giành lấy "quyền khai thác dữ liệu" cho kỷ nguyên AI tương lai.
Tuy nhiên, sự độc quyền luôn dẫn đến sự chống lại. Giống như các nền tảng tính toán phân tán cố gắng lật đổ dịch vụ điện toán đám mây tập trung, một dự án AI Web3 đang cố gắng định nghĩa lại quy tắc phân phối giá trị của việc đánh dấu dữ liệu bằng công nghệ blockchain. Vấn đề chính của mô hình đánh dấu dữ liệu truyền thống không nằm ở công nghệ, mà ở thiết kế cơ chế khuyến khích.
Ví dụ, một bác sĩ có thể mất hàng giờ để đánh dấu hình ảnh y tế, nhưng chỉ nhận được phần thưởng rất ít, trong khi mô hình AI được đào tạo từ những dữ liệu này có thể có giá trị lên đến hàng tỷ đô la, nhưng bác sĩ lại không thể chia sẻ trong lợi nhuận đó. Sự phân bổ giá trị cực kỳ không công bằng này đã làm tổn hại nghiêm trọng đến động lực cung cấp dữ liệu chất lượng cao.
Và thông qua cơ chế khuyến khích token của Web3, những người gán nhãn dữ liệu không còn là "công nhân dữ liệu" giá rẻ, mà là những "cổ đông" thực sự của mạng lưới mô hình ngôn ngữ AI. Rõ ràng, ưu thế của Web3 trong việc cải cách quan hệ sản xuất càng nổi bật hơn trong bối cảnh gán nhãn dữ liệu.
Điều đáng chú ý là dự án Web3 AI này lại chọn phát hành token gần thời điểm các ông lớn mạng xã hội công bố việc mua lại, đây có phải là sự trùng hợp hay đã được sắp xếp tỉ mỉ? Điều này có thể phản ánh một bước ngoặt của thị trường: dù là Web3 AI hay AI truyền thống, đều đã chuyển từ "cạnh tranh sức mạnh tính toán" sang giai đoạn mới "cạnh tranh chất lượng dữ liệu".
Khi các ông lớn truyền thống xây dựng rào cản dữ liệu bằng vốn, Web3 đang tiến hành một thí nghiệm "dân chủ hóa dữ liệu" quy mô lớn hơn bằng kinh tế mã thông báo. Cuộc "đọ sức ngầm" về quyền kiểm soát tương lai của AI này đã âm thầm bắt đầu, và kết quả của nó có thể tái cấu trúc toàn bộ bức tranh ngành công nghiệp AI.
Xem bản gốc
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
9 thích
Phần thưởng
9
5
Chia sẻ
Bình luận
0/400
MetaEggplant
· 4giờ trước
Lại là sự cứu rỗi của Blockchain, lần này sẽ lạnh bao lâu nữa?
Xem bản gốcTrả lời0
PumpStrategist
· 07-12 09:18
Đánh dấu công ty bơm lớn 14 lần, hình thái đã hình thành, đề xuất chờ pullback.
Xem bản gốcTrả lời0
ForkLibertarian
· 07-12 09:13
148 tỷ vàng thật bạc thật, ai còn chơi trò chơi Token?
Xem bản gốcTrả lời0
Ser_Liquidated
· 07-12 09:11
Không có ý nghĩa, chỉ là đồ ngốc chơi đùa với mọi người.
Xem bản gốcTrả lời0
DAOdreamer
· 07-12 09:05
Lại chỉ là trò chơi của các nhà đầu tư lớn mà thôi.
Cuộc chiến trong lĩnh vực gán nhãn dữ liệu AI: Đại gia mua lại 14,8 tỷ USD so với sự đổi mới kinh tế Token Web3
Cuộc cách mạng trong lĩnh vực gán nhãn dữ liệu AI: Từ việc mua lại với giá trên trời đến đổi mới Web3
Gần đây, ngành AI đã dấy lên một làn sóng về việc gán nhãn dữ liệu. Một ông lớn mạng xã hội đã mua lại gần nửa cổ phần của một công ty gán nhãn dữ liệu với mức giá kinh ngạc là 14,8 tỷ USD, gây chấn động toàn bộ giới công nghệ. Trong khi đó, một dự án Web3 AI sắp ra mắt token vẫn đang nỗ lực thoát khỏi nhãn "thổi phồng khái niệm". Phía sau sự tương phản rõ rệt này, thị trường dường như đã bỏ qua một số yếu tố then chốt.
Dữ liệu ghi nhãn như một lĩnh vực, giá trị của nó có thể vượt quá việc tập hợp sức mạnh tính toán phân phối. Mặc dù câu chuyện về việc sử dụng GPU nhàn rỗi để thách thức các ông lớn trong ngành điện toán đám mây thật hấp dẫn, nhưng sức mạnh tính toán về bản chất là một hàng hóa tiêu chuẩn hóa, điểm khác biệt chính nằm ở giá cả và khả năng tiếp cận. Một khi các doanh nghiệp lớn điều chỉnh chiến lược, lợi thế này có thể nhanh chóng biến mất.
So với điều đó, gán nhãn dữ liệu là một lĩnh vực khác biệt cần trí tuệ và phán đoán chuyên môn của con người. Mỗi gán nhãn chất lượng cao đều chứa đựng kiến thức chuyên môn độc đáo, bối cảnh văn hóa và kinh nghiệm nhận thức, điều này không thể dễ dàng sao chép như sức mạnh tính toán của GPU. Ví dụ, một gán nhãn chẩn đoán hình ảnh ung thư chính xác cần trực giác chuyên môn của bác sĩ ung thư kỳ cựu, trong khi một phân tích cảm xúc thị trường tài chính sâu sắc thì không thể thiếu kinh nghiệm thực chiến của các nhà giao dịch có kinh nghiệm. Sự khan hiếm và tính không thể thay thế tự nhiên này đã xây dựng nên một bức tường thành vững chắc cho ngành gán nhãn dữ liệu.
Một ông lớn trong lĩnh vực mạng xã hội gần đây đã công bố việc mua lại 49% cổ phần của một công ty gán nhãn dữ liệu với giá 14,8 tỷ USD, đây là khoản đầu tư lớn nhất trong lĩnh vực AI năm nay. Điều đáng chú ý hơn là người sáng lập và Giám đốc điều hành của công ty gán nhãn dữ liệu này sẽ đồng thời phụ trách "phòng thí nghiệm nghiên cứu siêu thông minh" mới thành lập của công ty mạng xã hội này.
Doanh nhân 25 tuổi này đã thành lập công ty vào năm 2016 khi còn là một sinh viên bỏ học, và hiện tại công ty mà anh quản lý đã đạt giá trị 30 tỷ USD. Danh sách khách hàng của công ty bao gồm nhiều doanh nghiệp AI nổi tiếng, nhà sản xuất ô tô, gã khổng lồ công nghệ và các cơ quan chính phủ. Công ty chuyên cung cấp dịch vụ gán nhãn dữ liệu chất lượng cao cho việc đào tạo mô hình AI, với hơn 300.000 nhân viên gán nhãn đã được đào tạo chuyên nghiệp.
Thương vụ mua lại này đã tiết lộ một sự thật bị bỏ qua: ở giai đoạn phát triển AI hiện tại, sức mạnh tính toán không còn là tài nguyên khan hiếm, cấu trúc mô hình cũng có xu hướng đồng nhất, điều thực sự quyết định giới hạn trí tuệ nhân tạo là những dữ liệu đã được xử lý một cách cẩn thận. Công ty truyền thông xã hội này không chỉ mua lại một công ty gia công với giá cao, mà đang giành lấy "quyền khai thác dữ liệu" cho kỷ nguyên AI tương lai.
Tuy nhiên, sự độc quyền luôn dẫn đến sự chống lại. Giống như các nền tảng tính toán phân tán cố gắng lật đổ dịch vụ điện toán đám mây tập trung, một dự án AI Web3 đang cố gắng định nghĩa lại quy tắc phân phối giá trị của việc đánh dấu dữ liệu bằng công nghệ blockchain. Vấn đề chính của mô hình đánh dấu dữ liệu truyền thống không nằm ở công nghệ, mà ở thiết kế cơ chế khuyến khích.
Ví dụ, một bác sĩ có thể mất hàng giờ để đánh dấu hình ảnh y tế, nhưng chỉ nhận được phần thưởng rất ít, trong khi mô hình AI được đào tạo từ những dữ liệu này có thể có giá trị lên đến hàng tỷ đô la, nhưng bác sĩ lại không thể chia sẻ trong lợi nhuận đó. Sự phân bổ giá trị cực kỳ không công bằng này đã làm tổn hại nghiêm trọng đến động lực cung cấp dữ liệu chất lượng cao.
Và thông qua cơ chế khuyến khích token của Web3, những người gán nhãn dữ liệu không còn là "công nhân dữ liệu" giá rẻ, mà là những "cổ đông" thực sự của mạng lưới mô hình ngôn ngữ AI. Rõ ràng, ưu thế của Web3 trong việc cải cách quan hệ sản xuất càng nổi bật hơn trong bối cảnh gán nhãn dữ liệu.
Điều đáng chú ý là dự án Web3 AI này lại chọn phát hành token gần thời điểm các ông lớn mạng xã hội công bố việc mua lại, đây có phải là sự trùng hợp hay đã được sắp xếp tỉ mỉ? Điều này có thể phản ánh một bước ngoặt của thị trường: dù là Web3 AI hay AI truyền thống, đều đã chuyển từ "cạnh tranh sức mạnh tính toán" sang giai đoạn mới "cạnh tranh chất lượng dữ liệu".
Khi các ông lớn truyền thống xây dựng rào cản dữ liệu bằng vốn, Web3 đang tiến hành một thí nghiệm "dân chủ hóa dữ liệu" quy mô lớn hơn bằng kinh tế mã thông báo. Cuộc "đọ sức ngầm" về quyền kiểm soát tương lai của AI này đã âm thầm bắt đầu, và kết quả của nó có thể tái cấu trúc toàn bộ bức tranh ngành công nghiệp AI.