Forklog
June 3, 2026 11:38 AM UTC

OpenAI представила GPT‑5.4 с компьютерным зрением 

Компания OpenAI выпустила GPT-5.4 и GPT-5.4 Pro спустя два дня после релиза версии 5.3 Instant.  GPT-5.4 Thinking and GPT-5.4 Pro are rolling out now in ChatGPT.GPT-5.4 is also now available in the API and Codex.GPT-5.4 brings our advances in reasoning, coding, and agentic workflows into one frontier model. pic.twitter.com/1hy6xXLAmJ— OpenAI (@OpenAI) March 5, 2026 Стандартная версия GPT-5.4 доступна в веб-интерфейсе ChatGPT, через API и в инструменте Codex. Версию GPT-5.4 Thinking открыли для подписчиков Plus, Team и Pro.  Для пользователей тарифа Pro и корпоративных клиентов Enterprise предназначена GPT-5.4 Pro, которая также доступна через API.  Базовая стоимость использования составляет $2,5 за 1 млн входных токенов и $15 за 1 млн выходных. Расценки для версии Pro заметно выше: $30 и $180 за 1 млн токенов соответственно. Производительность в рабочих задачах GPT-5.4 выдает более стабильные и качественные результаты в реальных сценариях применения. В бенчмарке GDPval, оценивающем выполнение задач по 44 профессиям, версия достигла показателя в 83%. Это означает, что модель работает на уровне профильных специалистов или превосходит их. Для сравнения, результат GPT-5.2 составлял 70,9%. Источник: OpenAI.  Особое внимание разработчики уделили работе с таблицами, презентациями и документами. В задачах уровня младшего аналитика инвестбанка GPT‑5.4 набрала 87,3% против 68,4% у GPT‑5.2.  Презентации от новой модели оценщики предпочитали в 68% случаев — за лучшую эстетику, разнообразие и эффективное использование генерации изображений. Источник: OpenAI.  GPT‑5.4 также стала самой точной моделью OpenAI с точки зрения работы с фактами. При тестировании на промптах с заранее известными ошибками: отдельные утверждения оказывались ложными на 33% реже; полные ответы содержали ошибки на 18% реже по сравнению с GPT‑5.2. Компьютерное зрение  Версия первой получила встроенные возможности компьютерного зрения и управления ПК. Модель способна использовать мышь и клавиатуру, ориентируясь на скриншоты, а также писать код для автоматизации через Playwright.  Поведение настраивается под конкретные сценарии с учетом допустимого уровня риска. В бенчмарке OSWorld-Verified (управление рабочим столом) GPT‑5.4 успешно выполнила 75% заданий, обойдя предыдущую версию (47,3%) и человека (72,4%). Прогресс связан с улучшенным визуальным восприятием: в тесте MMMU-Pro (понимание и логика) результат составил 81,2% против 79,5% у GPT-5.2; в OmniDocBench (анализ документов) средний показатель ошибок снизился с 0,140 до 0,109. Программирование  В кодинге модель сравнялась со специализированной GPT‑5.3‑Codex, но работает быстрее.  В Codex появился режим /fast, ускоряющий генерацию в полтора раза без потери качества. По результатам внутренних тестов GPT‑5.4 показала высокие результаты в сложных задачах фронтенд-разработки.  Также представлен экспериментальный навык Playwright (Interactive). Он позволяет модели визуально отлаживать веб- и Electron-приложения, тестируя собственный код прямо в процессе написания. Инструменты  В GPT‑5.4 появилась функция поиска инструментов (Tool Search). Раньше системе приходилось заранее загружать в контекст описания всех доступных плагинов. Это добавляло тысячи лишних токенов к каждому запросу и увеличивало стоимость. Теперь модель получает лишь базовый список и при необходимости самостоятельно находит и подгружает нужные параметры. В тестах на базе MCP Atlas такой подход снизил потребление токенов на 47% без потери точности. Веб-поиск также стал производительнее: в бенчмарке BrowseComp показатели выросли на 17%, а версия Pro достигла рекордных 89,3%. GPT‑5.4 Thinking эффективнее собирает информацию из множества источников, лучше прорабатывает сложные запросы и выдает более структурированные ответы. Управляемость и контекст При работе со сложными запросами GPT‑5.4 Thinking в ChatGPT сначала демонстрирует пользователю план действий. Это позволяет на ходу скорректировать направление, не перезапуская генерацию и не делая лишних уточнений. Функция уже доступна на сайте и в Android-приложении, скоро появится на iOS. Модель также лучше удерживает контекст в длинных диалогах и дольше обдумывает сложные задачи. Это помогает сохранять связность и релевантность ответов даже при работе с большими объемами информации. Напомним, в начале марта пользователи бойкотировали ChatGPT на фоне сделки OpenAI с Пентагоном. 

ChartModo Newsletter
阅读免责声明 : 此处提供的所有内容我们的网站,超链接网站,相关应用程序,论坛,博客,社交媒体帐户和其他平台(“网站”)仅供您提供一般信息,从第三方采购。 我们不对与我们的内容有任何形式的保证,包括但不限于准确性和更新性。 我们提供的内容中没有任何内容构成财务建议,法律建议或任何其他形式的建议,以满足您对任何目的的特定依赖。 任何使用或依赖我们的内容完全由您自行承担风险和自由裁量权。 在依赖它们之前,您应该进行自己的研究,审查,分析和验证我们的内容。 交易是一项高风险的活动,可能导致重大损失,因此请在做出任何决定之前咨询您的财务顾问。 我们网站上的任何内容均不构成招揽或要约