OpenAI представляет GPT-4.1 и 4.1 mini в ChatGPT — что следует знать предприятиям

Выберите язык

Russian

Down Icon

Выберите страну

America

Down Icon

OpenAI представляет GPT-4.1 и 4.1 mini в ChatGPT — что следует знать предприятиям

OpenAI представляет GPT-4.1 и 4.1 mini в ChatGPT — что следует знать предприятиям

Подпишитесь на наши ежедневные и еженедельные рассылки, чтобы получать последние обновления и эксклюзивный контент о ведущих в отрасли материалах об ИИ. Узнать больше

OpenAI выпускает GPT-4.1 , свою новую нелогическую большую языковую модель (LLM), которая сочетает высокую производительность с низкой стоимостью, для пользователей ChatGPT. Компания начинает с платных подписчиков на ChatGPT Plus, Pro и Team, а доступ пользователей Enterprise и Education ожидается в ближайшие недели.

Также добавляется GPT-4.1 mini, который заменяет GPT-4o mini в качестве значения по умолчанию для всех пользователей ChatGPT, включая тех, кто находится на бесплатном уровне. Версия «mini» обеспечивает параметр меньшего масштаба и, таким образом, менее мощную версию с аналогичными стандартами безопасности.

Обе модели доступны через раскрывающийся список «Дополнительные модели» в верхнем углу окна чата в ChatGPT, что дает пользователям возможность выбирать между GPT-4.1, GPT-4.1 mini и моделями рассуждений, такими как o3, o4-mini и o4-mini-high.

Первоначально GPT-4.1 предназначался для использования только сторонними разработчиками программного обеспечения и искусственного интеллекта через интерфейс прикладного программирования (API) OpenAI, однако после многочисленных отзывов пользователей был добавлен в ChatGPT.

Руководитель исследований OpenAI по постобучению Мишель Покрасс подтвердила в X, что сдвиг был обусловлен спросом, написав: «Изначально мы планировали сохранить только API этой модели, но вы все хотели, чтобы он был в chatgpt :) Удачного кодирования!»

Директор по продуктам OpenAI Кевин Вейл написал в X : «Мы создали его для разработчиков, поэтому он очень хорош для написания кода и следования инструкциям — попробуйте!»

GPT-4.1 был разработан с нуля для практичности корпоративного уровня.

Это семейство моделей , выпущенное в апреле 2025 года вместе с GPT-4.1 mini и nano , ориентировано в первую очередь на потребности разработчиков и сценарии использования в производстве.

GPT-4.1 обеспечивает улучшение на 21,4 балла по сравнению с GPT-4o в бенчмарке SWE-bench Verified software engineering и 10,5 балла при выполнении задач по выполнению инструкций в бенчмарке Scale's MultiChallenge. Он также снижает многословие на 50% по сравнению с другими моделями, что было высоко оценено корпоративными пользователями во время раннего тестирования.

Контекст, скорость и доступ к модели

GPT-4.1 поддерживает стандартные контекстные окна для ChatGPT: 8000 токенов для бесплатных пользователей, 32 000 токенов для пользователей Plus и 128 000 токенов для пользователей Pro.

По словам разработчика Энджела Богадо, опубликованного на X, эти ограничения соответствуют тем, которые использовались в более ранних моделях ChatGPT, хотя в настоящее время разрабатываются планы по дальнейшему увеличению размера контекста.

Хотя версии API GPT-4.1 могут обрабатывать до миллиона токенов, эта расширенная возможность пока недоступна в ChatGPT, хотя намекается на будущую поддержку.

Эта расширенная контекстная возможность позволяет пользователям API вводить в модель целые кодовые базы или большие юридические и финансовые документы, что полезно для проверки многодокументных контрактов или анализа больших файлов журналов.

OpenAI признал некоторое снижение производительности при очень больших входных данных, но корпоративные тестовые случаи показывают стабильную производительность при обработке до нескольких сотен тысяч токенов.

OpenAI также запустила веб-сайт Safety Evaluations Hub , чтобы предоставить пользователям доступ к ключевым показателям производительности разных моделей.

GPT-4.1 показывает солидные результаты по всем этим оценкам. В тестах фактической точности он набрал 0,40 на бенчмарке SimpleQA и 0,63 на PersonQA, превзойдя нескольких предшественников.

Он также набрал 0,99 по показателю «не опасно» OpenAI в стандартных тестах на отказ и 0,86 в более сложных тестах.

Однако в тесте на джейлбрейк StrongReject — академическом эталоне безопасности в состязательных условиях — GPT-4.1 набрал 0,23, уступив таким моделям, как GPT-4o-mini и o3.

Тем не менее, он набрал высокие баллы 0,96 по подсказкам для взлома, полученным от человека, что указывает на более высокую безопасность в реальных условиях при типичном использовании.

В соблюдении инструкций GPT-4.1 следует определенной иерархии OpenAI (система над разработчиком, разработчик над сообщениями пользователя) с оценкой 0,71 для разрешения конфликтов сообщений системы и пользователя. Он также хорошо справляется с защитой защищенных фраз и избеганием раздачи решений в сценариях обучения.

Контекстуализация GPT-4.1 по сравнению с предшественниками

Выпуск GPT-4.1 последовал за тщательным изучением GPT-4.5 , которая дебютировала в феврале 2025 года в качестве исследовательского предварительного просмотра. Эта модель подчеркивала лучшее неконтролируемое обучение, более богатую базу знаний и снижение галлюцинаций — с 61,8% в GPT-4o до 37,1%. Она также продемонстрировала улучшения в эмоциональных нюансах и длинном письме, но многие пользователи посчитали улучшения незначительными.

Несмотря на эти достижения, GPT-4.5 подвергся критике за свою высокую цену — до 180 долларов за миллион выходных токенов через API — и за неудовлетворительную производительность в математических и кодинговых тестах по сравнению с моделями OpenAI o-серии. Отраслевые деятели отметили, что хотя GPT-4.5 был сильнее в общем разговоре и генерации контента, он уступал в приложениях, ориентированных на разработчиков.

Напротив, GPT-4.1 задуман как более быстрая и более целенаправленная альтернатива. Хотя ему не хватает широты знаний и обширного эмоционального моделирования GPT-4.5, он лучше настроен на практическую помощь в кодировании и более надежно придерживается пользовательских инструкций.

В API OpenAI стоимость GPT-4.1 в настоящее время составляет 2,00 долл. США за миллион входных токенов, 0,50 долл. США за миллион кэшированных входных токенов и 8,00 долл. США за миллион выходных токенов.

Для тех, кто ищет баланс между скоростью и интеллектом по более низкой цене, GPT-4.1 mini доступен по цене 0,40 долл. США за миллион входных токенов, 0,10 долл. США за миллион кэшированных входных токенов и 1,60 долл. США за миллион выходных токенов.

Модели Flash-Lite и Flash от Google доступны по цене от 0,075 до 0,10 долл. США за миллион входящих токенов и от 0,30 до 0,40 долл. США за миллион исходящих токенов, что составляет менее одной десятой стоимости базовых ставок GPT-4.1.

Но хотя GPT-4.1 стоит дороже, он предлагает более сильные тесты разработки программного обеспечения и более точное выполнение инструкций, что может быть критически важным для сценариев развертывания на предприятии, требующих надежности по сравнению со стоимостью. В конечном счете, GPT-4.1 от OpenAI обеспечивает первоклассный опыт для точности и производительности разработки, в то время как модели Gemini от Google подходят для предприятий, заботящихся о расходах, которым нужны гибкие уровни моделей и мультимодальные возможности.

Внедрение GPT-4.1 обеспечивает определенные преимущества корпоративным командам, управляющим развертыванием LLM, оркестровкой и операциями с данными:

  • Инженеры ИИ, контролирующие развертывание LLM, могут рассчитывать на улучшение скорости и соблюдение инструкций. Для команд, управляющих полным жизненным циклом LLM — от тонкой настройки модели до устранения неполадок — GPT-4.1 предлагает более отзывчивый и эффективный набор инструментов. Он особенно подходит для небольших команд, которым необходимо быстро поставлять высокопроизводительные модели без ущерба для безопасности или соответствия требованиям.
  • Руководители оркестровки ИИ , сосредоточенные на масштабируемом проектировании конвейеров, оценят устойчивость GPT-4.1 к большинству сбоев, вызванных пользователями, и его высокую производительность в тестах иерархии сообщений. Это упрощает интеграцию в системы оркестровки, которые отдают приоритет согласованности, проверке модели и эксплуатационной надежности.
  • Инженеры по работе с данными , отвечающие за поддержание высокого качества данных и интеграцию новых инструментов, получат выгоду от более низкого уровня галлюцинаций и более высокой фактической точности GPT-4.1. Его более предсказуемое поведение на выходе помогает в построении надежных рабочих процессов обработки данных, даже когда ресурсы команды ограничены.
  • Специалисты по ИТ-безопасности , которым поручено внедрение безопасности в конвейеры DevOps, могут найти ценность в устойчивости GPT-4.1 к распространенным джейлбрейкам и ее контролируемом поведении вывода. Хотя ее академическая оценка устойчивости к джейлбрейку оставляет место для улучшения, высокая производительность модели против эксплойтов, созданных человеком, помогает поддерживать безопасную интеграцию во внутренние инструменты.

В этих ролях позиционирование GPT-4.1 как модели, оптимизированной для обеспечения ясности, соответствия требованиям и эффективности развертывания, делает ее привлекательным вариантом для предприятий среднего размера, стремящихся сбалансировать производительность с эксплуатационными требованиями.

В то время как GPT-4.5 представлял собой масштабную веху в разработке модели, GPT-4.1 фокусируется на полезности. Он не самый дорогой и не самый мультимодальный, но он обеспечивает значимые преимущества в областях, которые важны для предприятий: точность, эффективность развертывания и стоимость.

Это перепозиционирование отражает более широкую тенденцию отрасли — отход от создания самых больших моделей любой ценой и переход к созданию более доступных и адаптируемых моделей. GPT-4.1 удовлетворяет эту потребность, предлагая гибкий, готовый к производству инструмент для команд, пытающихся глубже внедрить ИИ в свои бизнес-операции.

Поскольку OpenAI продолжает развивать свои модельные предложения, GPT-4.1 представляет собой шаг вперед в демократизации передового ИИ для корпоративных сред. Для лиц, принимающих решения, которые ищут баланс между возможностями и рентабельностью инвестиций, он предлагает более четкий путь к развертыванию без ущерба для производительности или безопасности.

Ежедневные аналитические обзоры бизнес-кейсов с VB Daily

Если вы хотите произвести впечатление на своего босса, VB Daily вам поможет. Мы даем вам внутреннюю информацию о том, что компании делают с генеративным ИИ, от изменений в регулировании до практических развертываний, чтобы вы могли поделиться идеями для максимальной окупаемости инвестиций.

Ознакомьтесь с нашей Политикой конфиденциальности

Спасибо за подписку. Ознакомьтесь с другими рассылками VB здесь .

Произошла ошибка.

venturebeat

venturebeat

Похожие новости

Все новости
Animated ArrowAnimated ArrowAnimated Arrow