Forklog
June 3, 2026 11:38 AM UTC

OpenAI представила GPT‑5.4 с компьютерным зрением 

Компания OpenAI выпустила GPT-5.4 и GPT-5.4 Pro спустя два дня после релиза версии 5.3 Instant.  GPT-5.4 Thinking and GPT-5.4 Pro are rolling out now in ChatGPT.GPT-5.4 is also now available in the API and Codex.GPT-5.4 brings our advances in reasoning, coding, and agentic workflows into one frontier model. pic.twitter.com/1hy6xXLAmJ— OpenAI (@OpenAI) March 5, 2026 Стандартная версия GPT-5.4 доступна в веб-интерфейсе ChatGPT, через API и в инструменте Codex. Версию GPT-5.4 Thinking открыли для подписчиков Plus, Team и Pro.  Для пользователей тарифа Pro и корпоративных клиентов Enterprise предназначена GPT-5.4 Pro, которая также доступна через API.  Базовая стоимость использования составляет $2,5 за 1 млн входных токенов и $15 за 1 млн выходных. Расценки для версии Pro заметно выше: $30 и $180 за 1 млн токенов соответственно. Производительность в рабочих задачах GPT-5.4 выдает более стабильные и качественные результаты в реальных сценариях применения. В бенчмарке GDPval, оценивающем выполнение задач по 44 профессиям, версия достигла показателя в 83%. Это означает, что модель работает на уровне профильных специалистов или превосходит их. Для сравнения, результат GPT-5.2 составлял 70,9%. Источник: OpenAI.  Особое внимание разработчики уделили работе с таблицами, презентациями и документами. В задачах уровня младшего аналитика инвестбанка GPT‑5.4 набрала 87,3% против 68,4% у GPT‑5.2.  Презентации от новой модели оценщики предпочитали в 68% случаев — за лучшую эстетику, разнообразие и эффективное использование генерации изображений. Источник: OpenAI.  GPT‑5.4 также стала самой точной моделью OpenAI с точки зрения работы с фактами. При тестировании на промптах с заранее известными ошибками: отдельные утверждения оказывались ложными на 33% реже; полные ответы содержали ошибки на 18% реже по сравнению с GPT‑5.2. Компьютерное зрение  Версия первой получила встроенные возможности компьютерного зрения и управления ПК. Модель способна использовать мышь и клавиатуру, ориентируясь на скриншоты, а также писать код для автоматизации через Playwright.  Поведение настраивается под конкретные сценарии с учетом допустимого уровня риска. В бенчмарке OSWorld-Verified (управление рабочим столом) GPT‑5.4 успешно выполнила 75% заданий, обойдя предыдущую версию (47,3%) и человека (72,4%). Прогресс связан с улучшенным визуальным восприятием: в тесте MMMU-Pro (понимание и логика) результат составил 81,2% против 79,5% у GPT-5.2; в OmniDocBench (анализ документов) средний показатель ошибок снизился с 0,140 до 0,109. Программирование  В кодинге модель сравнялась со специализированной GPT‑5.3‑Codex, но работает быстрее.  В Codex появился режим /fast, ускоряющий генерацию в полтора раза без потери качества. По результатам внутренних тестов GPT‑5.4 показала высокие результаты в сложных задачах фронтенд-разработки.  Также представлен экспериментальный навык Playwright (Interactive). Он позволяет модели визуально отлаживать веб- и Electron-приложения, тестируя собственный код прямо в процессе написания. Инструменты  В GPT‑5.4 появилась функция поиска инструментов (Tool Search). Раньше системе приходилось заранее загружать в контекст описания всех доступных плагинов. Это добавляло тысячи лишних токенов к каждому запросу и увеличивало стоимость. Теперь модель получает лишь базовый список и при необходимости самостоятельно находит и подгружает нужные параметры. В тестах на базе MCP Atlas такой подход снизил потребление токенов на 47% без потери точности. Веб-поиск также стал производительнее: в бенчмарке BrowseComp показатели выросли на 17%, а версия Pro достигла рекордных 89,3%. GPT‑5.4 Thinking эффективнее собирает информацию из множества источников, лучше прорабатывает сложные запросы и выдает более структурированные ответы. Управляемость и контекст При работе со сложными запросами GPT‑5.4 Thinking в ChatGPT сначала демонстрирует пользователю план действий. Это позволяет на ходу скорректировать направление, не перезапуская генерацию и не делая лишних уточнений. Функция уже доступна на сайте и в Android-приложении, скоро появится на iOS. Модель также лучше удерживает контекст в длинных диалогах и дольше обдумывает сложные задачи. Это помогает сохранять связность и релевантность ответов даже при работе с большими объемами информации. Напомним, в начале марта пользователи бойкотировали ChatGPT на фоне сделки OpenAI с Пентагоном. 

ChartModo Newsletter
Loe lahtiütlusest : Kogu meie veebisaidi, hüperlingitud saitide, seotud rakenduste, foorumite, ajaveebide, sotsiaalmeediakontode ja muude platvormide ("Sait") siin esitatud sisu on mõeldud ainult teie üldiseks teabeks, mis on hangitud kolmandate isikute allikatest. Me ei anna meie sisu osas mingeid garantiisid, sealhulgas täpsust ja ajakohastust, kuid mitte ainult. Ükski meie poolt pakutava sisu osa ei kujuta endast finantsnõustamist, õigusnõustamist ega muud nõustamist, mis on mõeldud teie konkreetseks toetumiseks mis tahes eesmärgil. Mis tahes kasutamine või sõltuvus meie sisust on ainuüksi omal vastutusel ja omal äranägemisel. Enne nende kasutamist peate oma teadustööd läbi viima, analüüsima ja kontrollima oma sisu. Kauplemine on väga riskantne tegevus, mis võib põhjustada suuri kahjusid, palun konsulteerige enne oma otsuse langetamist oma finantsnõustajaga. Meie saidi sisu ei tohi olla pakkumine ega pakkumine