Будущее искусственного интеллекта: малые языковые модели (SLMs) как замена большим моделям (LLMs)

Будущее искусственного интеллекта: малые языковые модели (SLMs) как замена большим моделям (LLMs)

2

Являются ли малые языковые модели (SLMs) будущим искусственного интеллекта? Исследователи Nvidia считают, что да. Вот почему.

Эксперты Nvidia утверждают, что SLMs являются ключом к будущему сектора искусственного интеллекта (AI). Тем не менее, большинство инвестиций по-прежнему делается в большие языковые модели (LLMs). Если эта ситуация сохранится, индустрия может замедлиться, что впоследствии негативно скажется на экономике США.

Резюме

  • Большинство инвесторов в AI привлекают компании, работающие над продуктами на основе LLM.
  • SLM-агенты дешевле и часто более эффективны для конкретных задач, чем LLM.
  • Nvidia называет SLMs будущим искусственного интеллекта и призывает компании работать с более малыми моделями.

SLMs против LLMs

SLM являются моделями, обученными на 40 миллиардах параметров, которые превосходят в узком наборе определенных задач, при этом потребляя значительно меньше ресурсов. Другими словами, они дешевле.

LLMs дороги. В апреле генеральный директор OpenAI Сэм Альтман отметил, что флагманский продукт его компании, ChatGPT, стоит OpenAI десятки миллионов долларов, когда пользователи говорят «пожалуйста» и «спасибо». Это дает представление о дороговизне LLM. Вот здесь SLM показывают свои преимущества, так как им не нужны дорогие центры обработки данных для выполнения задач.

SLM, например, могут быть использованы в качестве чат-ботов для клиентской поддержки и не требуют обширных знаний по различным темам.

Согласно документу исследования Nvidia, опубликованному в июне, SLM-агенты являются будущим AI, а не агентами на основе LLM:

“…малые языковые модели (SLMs) достаточно мощные, по своей сущности более подходящие и экономически целесообразные для многих инвакаций в агентных системах, и, следовательно, являются будущим агентного AI.”

LLMs также помогают обучать SLMs, чтобы они не учились всему с нуля. Они учатся эффективно и быстро от больших моделей и становятся почти такими же хорошими в решении конкретных задач, не тратя много ресурсов.

Самые маленькие языковые модели обучаются на одном миллиарде параметров и могут работать на обычных ЦП.

Компании не нужны виртуальные существа с энциклопедическими знаниями. Им нужны инструменты, которые быстро и точно решают определенные задачи.

Вот почему дешевые SLM-агенты являются гораздо более доходными инвестициями, чем LLM. Примечательно, что GPT-5 использует несколько моделей, в том числе и маленькие, в зависимости от конкретных задач.

Ничто не может быть более унизительным, чем когда маршрутизатор GPT-5 определяет, что ваш запрос был слишком низким по IQ и перенаправляет вас к малой модели. — Эндрю Гао (@itsandrewgao) 2 сентября 2025 года.

Вы также можете быть заинтересованы

OpenAI достигает $10 миллиардов годового дохода, но фиксирует убыток в $5 миллиардов. Что произойдет, если сектор AI потерпит неудачу?

Крипто- и блокчейн-компании все чаще используют LLM для оптимизации операций и улучшения принятия решений. Платформы DeFi, такие как Zignaly, используют LLM для суммирования сделок и управления социальными инвестиционными инсайтами, в то время как инфраструктурные компании, такие как Platonic и Network3, применяют их для поддержки разработчиков и оптимизации процессов в цепочке блоков.

Торговые компании также сочетают LLM с другими инструментами AI для получения рыночной информации и предсказательной аналитики.

Но самые крупные проекты — это Gemini от Google, GPT от OpenAI, Claude от Anthropic и Grok от xAI. Каждый из них требует огромных центров обработки данных (много электроэнергии) и большого капитала.

Сектор AI в США привлек $109 миллиардов инвестиций только в 2024 году. В этом году американские AI-компании уже потратили $400 миллиардов на инфраструктуру. В августе стало известно, что OpenAI стремится продать акции на сумму $500 миллиардов. По словам Эндрю Шитса из Morgan Stanley, AI-компании могут потратить $3 триллиона на центры обработки данных к 2029 году.

Согласно исследованиям IDC, к 2030 году каждый доллар, потраченный на решения, основанные на AI, принесет $4,6 в мировую экономику.

Тем не менее, проблема сохраняется. Если центры обработки данных не будут строиться в достаточном количестве, это может оказать существенное влияние на экономику и отпугнуть крупных инвесторов. Как только инвесторы сократят свои вложения в AI-компании, расходы уменьшатся.

Замедление работы AI-компаний, использующих LLM, может быть вызвано такими факторами, как проблемы с поставками электроэнергии, высокие процентные ставки, торговая война и растущий спрос на SLM, среди прочих причин.

Что хуже, некоторые отмечают, что увеличение числа центров обработки данных создает пузырь, и это не так прекрасно, как эра доткомов, которая помогла поднять интернет на новые высоты. Проблема с центрами обработки данных заключается в том, что они используют чипы, которые в конечном итоге устаревают.

Это произойдет всего через несколько лет. Таким образом, хотя эти чипы и дороги, они не будут повторно использованы для других целей.

Как избежать коллапса

Чтобы избежать коллапса, исследователи Nvidia рекомендуют AI-компаниям использовать SLMs и увеличивать специализацию SLM-агентов.

Такой подход поможет сохранить ресурсы и повысить эффективность и конкурентоспособность.

Исследователи предполагают, что создание модульных агентских систем поможет сохранить гибкость и использовать LLM только для сложного рассуждения.

Читать далее: BNB пробивает исторический максимум в $929, CZ призывает банки принять Binance Coin.

OpenAI введет подтверждение личности для некоторых пользователей ChatGPT для защиты подростков
OpenAI введет подтверждение личности для некоторых пользователей ChatGPT для защиты подростков
OpenAI введет проверку личности для некоторых пользователей ChatGPT, чтобы усилить защиту подростков. Это мера в ответ на обеспокоенность взаимодействием несовершеннолетних с ИИ. 🔒👦💬
Просмотреть
Будущее труда: Как проектировать системы, способствующие человеческому росту в эпоху ИИ
Будущее труда: Как проектировать системы, способствующие человеческому росту в эпоху ИИ
Искусственный интеллект не заменит людей, но системы, созданные вокруг него, могут это сделать. Нужно строить гибкие экосистемы, которые учитывают человеческий потенциал и способствуют развитию. 🤖✨
Просмотреть
Непальская молодежь на протестах принимает Bitchat и Биткойн как технологии свободы
Непальская молодежь на протестах принимает Bitchat и Биткойн как технологии свободы
Непальские протестующие активно используют приложение Bitchat, созданное Джеком Дорси, для общения во время митингов против政府. Это инструмент свободы, позволяющий избежать цензуры 👥💬.
Просмотреть
KuCoin выбирает чемпиона Адама Скотта своим первым глобальным амбассадором в спонсорстве спорта и криптовалюты
KuCoin выбирает чемпиона Адама Скотта своим первым глобальным амбассадором в спонсорстве спорта и криптовалюты
KuCoin выбрала чемпиона Адама Скотта своим первым глобальным амбассадором, укрепляя связи между криптовалютой и спортом. Рост спонсорства крипто среди профессиональных спортсменов очевиден. 🏌️‍♂️💰📈
Просмотреть