- Главная
- /
- Другое
- /
- Будущее искусственного интеллекта: малые языковые модели (SLMs) как замена большим моделям (LLMs)

Будущее искусственного интеллекта: малые языковые модели (SLMs) как замена большим моделям (LLMs)
2
Являются ли малые языковые модели (SLMs) будущим искусственного интеллекта? Исследователи Nvidia считают, что да. Вот почему.
Эксперты Nvidia утверждают, что SLMs являются ключом к будущему сектора искусственного интеллекта (AI). Тем не менее, большинство инвестиций по-прежнему делается в большие языковые модели (LLMs). Если эта ситуация сохранится, индустрия может замедлиться, что впоследствии негативно скажется на экономике США.
Резюме
- Большинство инвесторов в AI привлекают компании, работающие над продуктами на основе LLM.
- SLM-агенты дешевле и часто более эффективны для конкретных задач, чем LLM.
- Nvidia называет SLMs будущим искусственного интеллекта и призывает компании работать с более малыми моделями.
SLMs против LLMs
SLM являются моделями, обученными на 40 миллиардах параметров, которые превосходят в узком наборе определенных задач, при этом потребляя значительно меньше ресурсов. Другими словами, они дешевле.
LLMs дороги. В апреле генеральный директор OpenAI Сэм Альтман отметил, что флагманский продукт его компании, ChatGPT, стоит OpenAI десятки миллионов долларов, когда пользователи говорят «пожалуйста» и «спасибо». Это дает представление о дороговизне LLM. Вот здесь SLM показывают свои преимущества, так как им не нужны дорогие центры обработки данных для выполнения задач.
SLM, например, могут быть использованы в качестве чат-ботов для клиентской поддержки и не требуют обширных знаний по различным темам.
Согласно документу исследования Nvidia, опубликованному в июне, SLM-агенты являются будущим AI, а не агентами на основе LLM:
“…малые языковые модели (SLMs) достаточно мощные, по своей сущности более подходящие и экономически целесообразные для многих инвакаций в агентных системах, и, следовательно, являются будущим агентного AI.”
LLMs также помогают обучать SLMs, чтобы они не учились всему с нуля. Они учатся эффективно и быстро от больших моделей и становятся почти такими же хорошими в решении конкретных задач, не тратя много ресурсов.
Самые маленькие языковые модели обучаются на одном миллиарде параметров и могут работать на обычных ЦП.
Компании не нужны виртуальные существа с энциклопедическими знаниями. Им нужны инструменты, которые быстро и точно решают определенные задачи.
Вот почему дешевые SLM-агенты являются гораздо более доходными инвестициями, чем LLM. Примечательно, что GPT-5 использует несколько моделей, в том числе и маленькие, в зависимости от конкретных задач.
Ничто не может быть более унизительным, чем когда маршрутизатор GPT-5 определяет, что ваш запрос был слишком низким по IQ и перенаправляет вас к малой модели. — Эндрю Гао (@itsandrewgao) 2 сентября 2025 года.
Вы также можете быть заинтересованы
OpenAI достигает $10 миллиардов годового дохода, но фиксирует убыток в $5 миллиардов. Что произойдет, если сектор AI потерпит неудачу?
Крипто- и блокчейн-компании все чаще используют LLM для оптимизации операций и улучшения принятия решений. Платформы DeFi, такие как Zignaly, используют LLM для суммирования сделок и управления социальными инвестиционными инсайтами, в то время как инфраструктурные компании, такие как Platonic и Network3, применяют их для поддержки разработчиков и оптимизации процессов в цепочке блоков.
Торговые компании также сочетают LLM с другими инструментами AI для получения рыночной информации и предсказательной аналитики.
Но самые крупные проекты — это Gemini от Google, GPT от OpenAI, Claude от Anthropic и Grok от xAI. Каждый из них требует огромных центров обработки данных (много электроэнергии) и большого капитала.
Сектор AI в США привлек $109 миллиардов инвестиций только в 2024 году. В этом году американские AI-компании уже потратили $400 миллиардов на инфраструктуру. В августе стало известно, что OpenAI стремится продать акции на сумму $500 миллиардов. По словам Эндрю Шитса из Morgan Stanley, AI-компании могут потратить $3 триллиона на центры обработки данных к 2029 году.
Согласно исследованиям IDC, к 2030 году каждый доллар, потраченный на решения, основанные на AI, принесет $4,6 в мировую экономику.
Тем не менее, проблема сохраняется. Если центры обработки данных не будут строиться в достаточном количестве, это может оказать существенное влияние на экономику и отпугнуть крупных инвесторов. Как только инвесторы сократят свои вложения в AI-компании, расходы уменьшатся.
Замедление работы AI-компаний, использующих LLM, может быть вызвано такими факторами, как проблемы с поставками электроэнергии, высокие процентные ставки, торговая война и растущий спрос на SLM, среди прочих причин.
Что хуже, некоторые отмечают, что увеличение числа центров обработки данных создает пузырь, и это не так прекрасно, как эра доткомов, которая помогла поднять интернет на новые высоты. Проблема с центрами обработки данных заключается в том, что они используют чипы, которые в конечном итоге устаревают.
Это произойдет всего через несколько лет. Таким образом, хотя эти чипы и дороги, они не будут повторно использованы для других целей.
Как избежать коллапса
Чтобы избежать коллапса, исследователи Nvidia рекомендуют AI-компаниям использовать SLMs и увеличивать специализацию SLM-агентов.
Такой подход поможет сохранить ресурсы и повысить эффективность и конкурентоспособность.
Исследователи предполагают, что создание модульных агентских систем поможет сохранить гибкость и использовать LLM только для сложного рассуждения.
Читать далее: BNB пробивает исторический максимум в $929, CZ призывает банки принять Binance Coin.

OpenAI введет подтверждение личности для некоторых пользователей ChatGPT для защиты подростков
OpenAI введет проверку личности для некоторых пользователей ChatGPT, чтобы усилить защиту подростков. Это мера в ответ на обеспокоенность взаимодействием несовершеннолетних с ИИ. 🔒👦💬

Будущее труда: Как проектировать системы, способствующие человеческому росту в эпоху ИИ
Искусственный интеллект не заменит людей, но системы, созданные вокруг него, могут это сделать. Нужно строить гибкие экосистемы, которые учитывают человеческий потенциал и способствуют развитию. 🤖✨

Непальская молодежь на протестах принимает Bitchat и Биткойн как технологии свободы
Непальские протестующие активно используют приложение Bitchat, созданное Джеком Дорси, для общения во время митингов против政府. Это инструмент свободы, позволяющий избежать цензуры 👥💬.

KuCoin выбирает чемпиона Адама Скотта своим первым глобальным амбассадором в спонсорстве спорта и криптовалюты
KuCoin выбрала чемпиона Адама Скотта своим первым глобальным амбассадором, укрепляя связи между криптовалютой и спортом. Рост спонсорства крипто среди профессиональных спортсменов очевиден. 🏌️♂️💰📈