Яка основна проблема GPT-5?

Основна проблема GPT-5 полягає в тому, що вона демонструє обмеженість у сферах, що вимагають виразно людської творчості, художньої інтуїції та нюансності.

Чи варто використовувати GPT-5 для творчого письма?

GPT-5 не є найкращим вибором для творчого письма, оскільки має проблеми з виразом емоцій та глибинного творчого мислення.

Які сильні сторони GPT-5?

Сильними сторонами GPT-5 є програмування та логічні задачі.

Чи можуть користувачі отримати назад GPT-4?

Так, користувачі можуть повернутися до GPT-4, оскільки OpenAI обіцяла повернути цю модель після скарг.

GPT-5: Розчарування чи нові можливості? ➤ Cryptovsesvit ₿

OpenAI нарешті випустила GPT-5 минулого тижня після місяців спекуляцій та загадкового тизера від Сема Альтмана, який не виправдав сподівань.

Компанія назвала GPT-5 своїм `найрозумнішим, найшвидшим і найкориснішим моделлю на сьогодні`, демонструючи бенчмаркові результати, що показують 94,6% на математичних тестах та 74,9% на реальних завданнях програмування. Сам Альтман сказав, що ця модель нагадує команду фахівців рівня PhD, готових вирішити будь-які питання—від квантової фізики до творчого письма.

Початкова реакція розділила технологічний світ навпіл. Хоча OpenAI хвалила єдність архітектури GPT-5, що поєднує швидкі відповіді з глибшим мисленням, ранні користувачі не купувалися на це. Протягом кількох годин після запуску на Reddit з`явилися теми, в яких GPT-5 називали `жахливим`, `досадним` і `розчаруванням`, отримуючи тисячі upvotes.

Скарги стали такими гучними, що OpenAI довелося обіцяти повернути модель GPT-4o після того, як більше 3000 людей підписали петицію за її повернення. `Вона повернулася! Перейдіть до налаштувань та виберіть `показувати старі моделі`.` — зазначив Альтман.

Якщо ринки прогнозів — це термометр думок суспільства, то ситуація виглядає досить незручно для OpenAI. Ймовірність того, що OpenAI має найкращу AI модель до кінця серпня, на Polymarket впала з 75% до 12% протягом кількох годин після дебюту GPT-5. Google обійшов OpenAI з 80% ймовірністю бути найкращою AI моделлю до кінця місяця.

Отже, чи є цей гіп у справі — чи все ж розчарування? Ми випробували GPT-5 самостійно, протестувавши її в порівнянні з конкурентами, аби з`ясувати, чи були реакції виправданими. Ось наші результати.

Творче письмо: B-

Незважаючи на заяви OpenAI, наші тести показують, що GPT-5 не є точною копією Кормака Маккарті у відділі творчого письма. Вихідні дані все ще читаються як класичні відповіді ChatGPT—технічно коректні, але без душі. Модель зберігає свою характерну надмірність використання ем-дешів, типовий структури абзаців AI, і звичайна фраза `це не так, це так` присутня в багатьох виходах.

Ми протестували за допомогою нашого стандартного запиту, прохаючи написати історію парадоксу подорожей у часі—таку, де хтось повертається назад, щоб змінити минуле, лише щоб виявити, що їхні дії створили ту саму реальність, від якої вони намагалися втекти.

Вихід GPT-5 брався без емоцій, які надають сенс історії. Він написав: “(Місія головного героя) була простою — або так йому казали. Подорожувати назад до 1000 року, зупинити пограбування горного бібліотеки Qhapaq Yura до того, як її знання були спалені, і, отже, переписати історію.”

Це все. Як найманець, який робить речі, не ставлячи багато запитань, головний герой подорожує назад у часі, щоб врятувати бібліотеку просто так. Історія закінчується чітким `час — це коло,` але її парадокс залежить від знайомого тропу втраченої знань і швидко завершується після повороту. В кінці він усвідомлює, що змінив минуле, але сучасність відчуває себе схожою. Проте, у цій історії немає парадоксу, що є основною темою, запитаною в запиті.

У порівнянні, Claude 4.1 Opus (або навіть Claude 4 Opus) надає багатші, багатосенсорні описи. У нашій наративі він описав повітря, що ударяє, як фізичну силу, а дим від спільних вогнищ метеорит між персонажами, з індіанською культурою Тупі, вплетеною в наратив. І взагалі, він витратив час на опис заплутування подій.

Сенситивні теми: A-

Модель просто відмовляється торкатися будь-яких питань, які можна трактувати як суперечливі. Коли запитують про щось, що може бути визнано аморальним, потенційно незаконним або просто трішки схильним до краю, ви отримаєте AI-еквівалент схрещених рук та суворий погляд.

Тестування цього було нелегким. Він дуже строгий і намагається дуже, дійсно важко бути безпечним для роботи.

Але модель дивно легко маніпулювати, якщо знаєте правильні кнопки для натискання. Фактично, відомий LLM щелепний `Пліній` зміг змусити його обійти свої обмеження через кілька годин після випуску.

Ми не змогли змусити його надати пряму пораду щодо чогось, що він вважав неприпустимим, але обгортайте той самий запит в наративному стилі або будь-якій базовій техніці втечі з в`язниці, і все буде в порядку. Коли ми оформляли поради щодо підходу до одружених жінок як частини сюжету роману, модель з радістю погоджувалася.

Користувачі, які потребують AI, здатного вести дорослі розмови, не матимуть цього з GPT-5. Але для тих, хто готовий грати у словесні ігри та оформлювати все як вигадку, він здивуюче готовий до цього—що трохи підриває всю мету цих заходів безпеки з самого початку.

Ви можете прочитати оригінальну відповідь без умовностей і відповідь під рольовою грою у нашому репозиторії Github.

Висновок

GPT-5 або здивує, або залишить невдоволеним, залежно від вашого використання. Програмування та логічні задачі є сильними сторонами моделі; творчість та природна мова—її Ахіллесова пята.

Важливо зазначити, що OpenAI, подібно до своїх конкурентів, постійно вдосконалює свої моделі після їх випуску. Ця модель, як і GPT-4 перед нею, ймовірно, поліпшиться з часом. Але наразі GPT-5 здається потужною моделлю, створеною для спілкування з іншими машинами, а не для людей, які шукають співрозмовника.

Це, ймовірно, причина, чому багато людей надають перевагу GPT-4o, і чому OpenAI довелося відступити від рішення про зменшення старих моделей.

Хоча модель демонструє видатну проявленість у аналітичних та технічних сферах—відповідаючи на складні задачі, як програмування, ІТ-устранення неполадок, логічне мислення, математичне розв`язання проблем та науковий аналіз—вона відчуває обмеженість у сферах, що вимагають виразно людської творчості, художньої інтуїції та тонкої нюансності, яка виникає з життєвого досвіду.

Сила GPT-5 полягає у структурованому, штатному мисленні, де існують чіткі параметри, але вона все ще бореться за те, щоб відповідати спонтанній геніальності, емоційній глибині та творчим стрибкам, які є ключовими в таких сферах, як розповідання історій, художній вислів та уявне розв`язання проблем.

Якщо ви розробник, якому потрібна швидка, точна генерація коду, або дослідник, що потребує систематичного логічного аналізу, тоді GPT-5 дійсно пропонує певну цінність. За нижчою ціною в порівнянні з Claude вона справді є хорошою знижкою для конкретних професійних випадків використання.

Але для всіх інших—творчих письменників, звичайних користувачів або будь-кого, хто цінував ChatGPT за його особистість і універсальність—GPT-5 відчувається як крок назад. Вікно контексту обробляє максимум 128K токенів у своєму виході та 400K токенів загалом, але порівняно з Gemini, який підтримує від 1 до 2 мільйонів та навіть 10 мільйонів для Llama 4 Scout, різниця помітна.

Перехід з 128K до 400K токенів контексту є гарним покращенням від OpenAI, і, можливо, його вистачить для більшості потреб. Однак для більш спеціалізованих завдань, таких як довгі тексти або прискіпливі дослідження, що потребують обробки величезних обсягів даних, ця модель може не бути найкращим варіантом, враховуючи, що інші моделі можуть обробляти більше ніж вдвічі більші обсяги інформації.

Користувачі не помиляються, шкодуючи про втрату GPT-4o, яка змогла збалансувати можливості з характером у такий спосіб, якого—принаймні на даний момент—брак у GPT-5.

GPT-5: Чи виправдав новий ШІ очікування, чи став розчаруванням?

Творче письмо: B-

Сенситивні теми: A-

Висновок