SLM як ключ до майбутнього штучного інтелекту: чому малі мовні моделі стають вигіднішими за великі

SLM як ключ до майбутнього штучного інтелекту: чому малі мовні моделі стають вигіднішими за великі

6

Чи є SLM майбутнім штучного інтелекту? Дослідники компанії Nvidia вважають, що так. Ось чому.

Експерти Nvidia стверджують, щоМалі Мовні Моделі (SLMs) є ключем до майбутнього сектора штучного інтелекту (ШІ). Однак більшість інвестицій все ще спрямовано наВеликі Мовні Моделі (LLMs). Якщо така ситуація збережеться, індустрія може сповільнитися, що в результаті вплине на економіку США.

Огляд

  • Більшість інвесторів у ШІ орієнтовані на компанії, що розробляють продукти на базі LLM.
  • SLM-агенти є дешевшими та часто ефективнішими для специфічних завдань, ніж LLM.
  • Nvidia вважає SLM майбутнім ШІ та закликає компанії працювати з меншими моделями.

SLM проти LLM

SLMs навчаються на даних до40 мільярдів параметрів, демонструючи відмінні результати у вузькому наборі визначених завдань і споживаючи значно менше ресурсів. Іншими словами, вони є дешевшими.

LLMs дорого обійдуться компаніям. У квітні генеральний директор OpenAI Сем Альтман знаменитим чином зазначив, що продукт компанії ChatGPT коштує OpenAI десятки мільйонів доларів, коли користувачі кажуть `будь ласка` і `дякую`. Це вказує на витрати, пов’язані з LLM. Тут SLMs виходять на перший план, адже їхнє використання не потребує дорогих дата-центрів для виконання завдань.

SLMs, наприклад, можуть служити чат-ботами для підтримки клієнтів і не потребують глибоких знань з багатьох тем.

Згідно з дослідженням Nvidia, яке було опубліковане в червні, SLM-агенти є майбутнім ШІ, а не LLM-агенти:

“…малі мовні моделі (SLMs) є достатньо потужними, внутрішньо більш підходящими і, звичайно, економічнішими для багатьох завдань в агентних системах, і тому є майбутнім агентного ШІ.”

LLMs також допомагають у навчанні SLM, так що їм не потрібно засвоювати всі дані з нуля. Вони ефективно та швидко навчаються на основі великих моделей і стають практично такими ж хорошими у вирішенні специфічних завдань, не витрачаючи багато ресурсів.

Найдоступніші мовні моделі навчаються наодному мільярді параметрів і можуть працювати на звичайних процесорах.

Компаніям не потрібні віртуальні істоти з енциклопедичними знаннями. Натомість їм потрібні інструменти, які швидко та точно вирішують певні завдання.

Ось чому дешеві SLM-агенти є набагато прибутковішими інвестиціями, ніж LLM. Зокрема, GPT-5 використовує кілька моделей, включаючи маленькі, в залежності від специфічних завдань.

Які можливі наслідки?

Крипто- та блокчейн-компанії все частіше використовують LLM для оптимізації операцій і покращення прийняття рішень. Платформи DeFi, такі як Zignaly, використовують LLM для підсумовування угод і управління соціальними інвестиційними даними, в той час як інфраструктурні компанії, такі як Platonic і Network3, використовують їх для підтримки розробників та оптимізації робочих процесів в мережі.

Торгові компанії також поєднують LLM з іншими інструментами ШІ для аналізу ринку та прогностичної аналітики.

Але найбільшими проектами єGemini від Google,GPT від OpenAI,Claude від Anthropic таGrok від xAI. Кожен з них потребує величезних дата-центрів (багато електроенергії) та значних капіталовкладень.

Сектор ШІ в США залучив$109 мільярдів інвестицій тільки в 2024 році. Цього року американські компанії в ШІ вже витратили$400 мільярдів на інфраструктуру. У серпні повідомлялося, що OpenAI прагне продати акції на $500 мільярдів. Згідно з прогнозом Ендрю Шіця з Morgan Stanley, компанії ШІ можуть витратити$3 трильйони на дата-центри до 2029 року.

Згідно з дослідженнями IDC, до 2030 року кожен долар, витрачений на бізнес-рішення на базі ШІ, принесе$4.6 для глобальної економіки.

Проте проблема залишається. Якщо недостатньо дата-центрів будується, це може суттєво вплинути на економіку і налякати великих інвесторів. Як тільки інвестори зменшать своє фінансування в компанії ШІ, витрати зменшаться.

Сповільнення компаній ШІ, що використовують LLM, може бути викликане факторами, такими як проблеми з постачанням електроенергії, високі процентні ставки, торгові війни та зростаючий попит на SLM, серед інших причин.

Що ще гірше, деякі зазначають, що надмірне зростання дата-центрів створює бульбашку, яка не є такою привабливою, як епоха доткомів, що сприяла прокладці Інтернету до нових висот. Проблема з дата-центрами полягає в тому, що вони використовують чіпи, які врешті-решт стануть застарілими.

Це станеться всього за кілька років. Таким чином, поки ці чіпи дорогі, їх не можна буде повторно використовувати для інших цілей.

Як уникнути краху

Щоб уникнути краху, дослідники Nvidia рекомендують компаніям ШІ обирати SLM і підвищувати спеціалізацію SLM-агентів.

Такий підхід допоможе зберегти ресурси та підвищити ефективність і конкурентоспроможність.

Дослідники пропонують створити модульні агентні системи, які допоможуть зберегти гнучкість і використовувати LLM лише для складних розрахунків.

OpenAI запроваджує верифікацію особи для користувачів ChatGPT з метою захисту підлітків
OpenAI запроваджує верифікацію особи для користувачів ChatGPT з метою захисту підлітків
OpenAI вводить верифікацію особи для деяких користувачів ChatGPT, щоб покращити безпеку підлітків. Це частина нових заходів для контролю взаємодії молодших користувачів з AI. 🔒👦💬
Переглянути
Штучний інтелект як партнер: чому системи мають підтримувати людський розвиток, а не замінювати його
Штучний інтелект як партнер: чому системи мають підтримувати людський розвиток, а не замінювати його
Штучний інтелект не замінить людей, але системи, що його оточують, можуть це зробити. Майбутнє праці залежить від адаптивних, людяних структур для підвищення потенціалу. 🌐🤖💼
Переглянути
Непал: молодь протестує за свободу через Bitchat і Bitcoin
Непал: молодь протестує за свободу через Bitchat і Bitcoin
Непальські протестувальники активно використовують Bitchat для безцебурності в умовах заборони соцмереж. Технології свободи, такі як Bitcoin і Nostr, допомагають їм у боротьбі з корупцією та зловживанням владою. 💪🌐🚫📱🗳️
Переглянути
KuCoin залучив гольф-ікону Адама Скотта для спонсорства у професійному спорті
KuCoin залучив гольф-ікону Адама Скотта для спонсорства у професійному спорті
KuCoin обрав гольфіста Адама Скотта своїм першим глобальним амбасадором, починаючи етап спонсорства в спорті. Загальні витрати на криптоспонсорство зросли до 565 млн доларів. 🏌️‍♂️💰🌍
Переглянути