Новий ландшафт у сфері позначення даних AI: від конкуренції в обчислювальній потужності до битви за якість даних
Нещодавно технологічний гігант Meta придбав майже половину акцій компанії з маркування даних Scale AI за 14,8 мільярда доларів, що викликало хвилювання у всій Силіконовій долині і розглядається як перепризначення індустрії "маркування даних". Тим часом, деякі Web3 AI проекти все ще намагаються позбутися ярлика "концептуальної спекуляції". За цим величезним контрастом, здається, що ринок ігнорує деякі ключові фактори.
Позначення даних має більшу цінність, ніж агрегування децентралізованих обчислювальних потужностей. Хоча історія про використання бездіяльних GPU для виклику великих хмарних провайдерів є захоплюючою, обчислювальна потужність за своєю сутністю є стандартизованим товаром, основні відмінності полягають у ціні та доступності. Як тільки гіганти знижують ціни або збільшують постачання, ця перевага легко стирається.
У порівнянні, розмітка даних є сферою, що потребує людської мудрості та професійного судження. Високоякісна розмітка несе в собі унікальні спеціалізовані знання, культурний контекст і когнітивний досвід, які не можна стандартизовано відтворити, як обчислювальну потужність GPU. Наприклад, точна розмітка діагностики раку на зображеннях потребує професійної інтуїції досвідченого онколога, тоді як досвід аналізу емоцій фінансових ринків неможливий без практичного досвіду трейдерів Уолл-Стріт. Ця рідкість і незамінність надають розмітці даних глибокий захист.
Дії Meta щодо придбання Scale AI заслуговують на увагу. Засновник і CEO Scale AI Александра Ванга також буде очолювати новостворену дослідницьку лабораторію "Суперінтелект" в Meta. Компанія, заснована цим 25-річним підприємцем, вже оцінюється в 30 мільярдів доларів, а її клієнтами є кілька провідних AI компаній та установ.
Ця угода виявила ігнорований факт: Обчислювальна потужність більше не є дефіцитом, архітектура моделей стає однорідною, справжнім чинником, що визначає верхню межу інтелекту ШІ, є дані, які були ретельно "налаштовані". Дії Meta можна розглядати як боротьбу за "права на видобуток нафти" в епоху ШІ.
Однак монополія завжди викликає опір. Деякі Web3 AI проекти намагаються переписати правила розподілу цінності даних за допомогою блокчейну. Основна проблема традиційної моделі маркування даних полягає в нерозумному дизайні стимулів. Наприклад, лікар, який витрачає кілька годин на маркування медичних зображень, може отримати лише кілька десятків доларів винагороди, тоді як AI модель, навчена на цих даних, може коштувати десятки мільярдів доларів, і лікар не може поділитися часткою доходу.
Механізм стимулювання токенів Web3 має надію змінити цю ситуацію, перетворюючи постачальників даних з дешевих "фермерів даних" на справжніх "акціонерів" AI-мережі. Переваги Web3 у перетворенні виробничих відносин особливо виражені у сценаріях маркування даних.
Ринок, здається, перебуває на роздоріжжі: як Web3 AI, так і традиційний AI вже перейшли від "Обчислювальної потужності" до "якісних даних". Коли традиційні гіганти зводять бар'єри даних за допомогою грошей, Web3 створює більший експеримент з "демократизації даних" за допомогою токеноміки. Ця "темна війна" за контроль над майбутнім AI вже тихо почалася.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
Новий формат позначення даних AI: від боротьби за обчислювальну потужність до конкуренції за високоякісні дані
Новий ландшафт у сфері позначення даних AI: від конкуренції в обчислювальній потужності до битви за якість даних
Нещодавно технологічний гігант Meta придбав майже половину акцій компанії з маркування даних Scale AI за 14,8 мільярда доларів, що викликало хвилювання у всій Силіконовій долині і розглядається як перепризначення індустрії "маркування даних". Тим часом, деякі Web3 AI проекти все ще намагаються позбутися ярлика "концептуальної спекуляції". За цим величезним контрастом, здається, що ринок ігнорує деякі ключові фактори.
Позначення даних має більшу цінність, ніж агрегування децентралізованих обчислювальних потужностей. Хоча історія про використання бездіяльних GPU для виклику великих хмарних провайдерів є захоплюючою, обчислювальна потужність за своєю сутністю є стандартизованим товаром, основні відмінності полягають у ціні та доступності. Як тільки гіганти знижують ціни або збільшують постачання, ця перевага легко стирається.
У порівнянні, розмітка даних є сферою, що потребує людської мудрості та професійного судження. Високоякісна розмітка несе в собі унікальні спеціалізовані знання, культурний контекст і когнітивний досвід, які не можна стандартизовано відтворити, як обчислювальну потужність GPU. Наприклад, точна розмітка діагностики раку на зображеннях потребує професійної інтуїції досвідченого онколога, тоді як досвід аналізу емоцій фінансових ринків неможливий без практичного досвіду трейдерів Уолл-Стріт. Ця рідкість і незамінність надають розмітці даних глибокий захист.
Дії Meta щодо придбання Scale AI заслуговують на увагу. Засновник і CEO Scale AI Александра Ванга також буде очолювати новостворену дослідницьку лабораторію "Суперінтелект" в Meta. Компанія, заснована цим 25-річним підприємцем, вже оцінюється в 30 мільярдів доларів, а її клієнтами є кілька провідних AI компаній та установ.
Ця угода виявила ігнорований факт: Обчислювальна потужність більше не є дефіцитом, архітектура моделей стає однорідною, справжнім чинником, що визначає верхню межу інтелекту ШІ, є дані, які були ретельно "налаштовані". Дії Meta можна розглядати як боротьбу за "права на видобуток нафти" в епоху ШІ.
Однак монополія завжди викликає опір. Деякі Web3 AI проекти намагаються переписати правила розподілу цінності даних за допомогою блокчейну. Основна проблема традиційної моделі маркування даних полягає в нерозумному дизайні стимулів. Наприклад, лікар, який витрачає кілька годин на маркування медичних зображень, може отримати лише кілька десятків доларів винагороди, тоді як AI модель, навчена на цих даних, може коштувати десятки мільярдів доларів, і лікар не може поділитися часткою доходу.
Механізм стимулювання токенів Web3 має надію змінити цю ситуацію, перетворюючи постачальників даних з дешевих "фермерів даних" на справжніх "акціонерів" AI-мережі. Переваги Web3 у перетворенні виробничих відносин особливо виражені у сценаріях маркування даних.
Ринок, здається, перебуває на роздоріжжі: як Web3 AI, так і традиційний AI вже перейшли від "Обчислювальної потужності" до "якісних даних". Коли традиційні гіганти зводять бар'єри даних за допомогою грошей, Web3 створює більший експеримент з "демократизації даних" за допомогою токеноміки. Ця "темна війна" за контроль над майбутнім AI вже тихо почалася.