Skip to content

Обзор моделей

Основные модели

GPT-4o

Наш флагманский интеллектуальный образец для сложных многошаговых задач.

  • Ввод текста и изображений, вывод текста
  • Контекстная длина 128k
  • Умнее модель, выше цена за токен

GPT-4o mini

Доступная и умная мини-модель для быстрых и нетрудоёмких задач.

  • Ввод текста и изображений, вывод текста
  • Контекстная длина 128k
  • Быстрая модель, низкая цена за токен

o1-preview и o1-mini (beta)

Новая серия моделей рассуждения для решения сложных задач.

  • Ввод текста, вывод текста
  • Контекстная длина 128k
  • Высокая задержка, использует токены для мышления

Детали о ценах моделей

Обзор моделей

OpenAI API работает на основе различных моделей с различными возможностями и точками цены. Вы также можете настроить наши модели под ваши нужды с помощью тонкой настройки.

МОДЕЛЬОПИСАНИЕ
GPT-4oНаш флагманский интеллектуальный образец для сложных многошаговых задач
GPT-4o miniНаша доступная и умная малогабаритная модель для быстрых, нетрудоёмких задач
o1-preview и o1-miniЛингвистические модели, обученные с помощью обучения с подкреплением для выполнения сложных задач
GPT-4 Turbo и GPT-4Предыдущий набор высокоинтеллектуальных моделей
GPT-3.5 TurboБыстрая, недорогая модель для простых задач
DALL·EМодель для генерации и редактирования изображений на основе текстового описания
TTSНабор моделей, преобразующих текст в естественное звучание аудио речи
WhisperМодель, преобразующая аудио в текст
EmbeddingsНабор моделей, преобразующих текст в числовую форму
ModerationНастроенная модель, обнаруживающего потенциально чувствительный или небезопасный текст
УстаревшиеПолный список устаревших моделей вместе с рекомендованной заменой

Для моделей серии GPT, контекстное окно относится к максимальному числу токенов, которые могут быть использованы в одном запросе, включая как входные, так и выходные токены.

Мы также опубликовали модели с открытым исходным кодом, включая Point-E, Whisper, Jukebox и CLIP.

Непрерывные обновления моделей

gpt-4o, gpt-4o-mini, gpt-4-turbo, gpt-4 и gpt-3.5-turbo указывают на свои соответствующие последние версии моделей. Вы можете проверить это, обратившись к объекту ответа после отправки запроса. Ответ включает версию модели, использованную в запросе (например, gpt-3.5-turbo-1106). Модель chatgpt-4o-latest постоянно указывает на версию GPT-4o, используемую в ChatGPT, и часто обновляется при значительных изменениях. За исключением chatgpt-4o-latest, мы предлагаем закрепленные версии моделей, которые разработчики могут продолжать использовать минимум три месяца после внедрения обновлённой модели.

Узнайте больше о снятии моделей на нашей странице снятия с производства.

GPT-4o

GPT-4o («o» для «omni») — наша самая продвинутая модель GPT. Это мультимодальная модель (принимает текст или изображение и выводит текст) с такой же высокой степенью интеллекта, как GPT-4 Turbo, но более эффективна — она генерирует текст в 2 раза быстрее и стоит на 50% дешевле. Кроме того, GPT-4o обладает лучшим зрением и производительностью на других языках, кроме английского, чем любая из наших моделей. GPT-4o доступен в OpenAI API для платных клиентов. Узнайте, как использовать GPT-4o в нашем руководстве по генерации текста.

МОДЕЛЬКОНТЕКСТНОЕ ОКНОМАКС. ВЫХОДНЫЕ ТОКЕНЫТРЕНИРОВОЧНЫЕ ДАННЫЕ
gpt-4o128,000 токенов16,384 токеновДо октября 2023
gpt-4o-2024-08-06128,000 токенов16,384 токеновДо октября 2023
gpt-4o-2024-05-13128,000 токенов4,096 токеновДо октября 2023
chatgpt-4o-latest128,000 токенов16,384 токеновДо октября 2023

GPT-4o mini

GPT-4o mini («o» для «omni») — наша самая продвинутая в категории малых моделей и самая дешевая модель на данный момент. Это мультимодальная модель (принимает текст или изображение и выводит текст), имеет более высокий уровень интеллекта, чем gpt-3.5-turbo, но работает с такой же скоростью. Она предназначена для выполнения более мелких задач, включая задачи с визуальными возможностями.

Мы рекомендуем использовать gpt-4o-mini, где ранее использовалась gpt-3.5-turbo, так как эта модель более способна и дешевле.

МОДЕЛЬКОНТЕКСТНОЕ ОКНОМАКС. ВЫХОДНЫЕ ТОКЕНЫТРЕНИРОВОЧНЫЕ ДАННЫЕ
gpt-4o-mini128,000 токенов16,384 токеновДо октября 2023
gpt-4o-mini-2024-07-18128,000 токенов16,384 токеновДо октября 2023

GPT-4o Realtime + Audio Beta

Это предварительный выпуск моделей GPT-4o Realtime и Audio. Модели gpt-4o-realtime-* способны отвечать на аудио и текстовые входные данные через интерфейс WebSocket. Узнайте больше в руководстве по Realtime API. Модели gpt-4o-audio-* ниже можно использовать в Chat Completions для генерации аудиорежимов.

МОДЕЛЬКОНТЕКСТНОЕ ОКНОМАКС. ВЫХОДНЫЕ ТОКЕНЫТРЕНИРОВОЧНЫЕ ДАННЫЕ
gpt-4o-realtime-preview128,000 токенов4,096 токеновДо октября 2023
gpt-4o-realtime-preview-2024-10-01128,000 токенов4,096 токеновДо октября 2023
gpt-4o-audio-preview128,000 токенов16,384 токеновДо октября 2023
gpt-4o-audio-preview-2024-10-01128,000 токенов16,384 токеновДо октября 2023

o1-preview и o1-mini Beta

Серия больших языковых моделей o1 обучается с подкреплением для выполнения сложных рассуждений. Модели o1 обдумывают перед ответом, создавая длинную внутреннюю цепочку рассуждений перед тем, как ответить пользователю. Узнайте о возможностях и ограничениях моделей o1 в нашем руководстве по рассуждению.

Доступны два типа моделей:

  • o1-preview: модель рассуждения, предназначенная для решения сложных задач в разных областях.
  • o1-mini: более быстрая и дешевая модель рассуждения, особенно хорошая в программировании, математике и науке.
МОДЕЛЬКОНТЕКСТНОЕ ОКНОМАКС. ВЫХОДНЫЕ ТОКЕНЫТРЕНИРОВОЧНЫЕ ДАННЫЕ
o1-preview128,000 токенов32,768 токеновДо октября 2023
o1-preview-2024-09-12128,000 токенов32,768 токеновДо октября 2023
o1-mini128,000 токенов65,536 токеновДо октября 2023
o1-mini-2024-09-12128,000 токенов65,536 токеновДо октября 2023

GPT-4 Turbo и GPT-4

GPT-4 — это крупная мультимодальная модель (принимает текст или изображение и выводит текст), способная решать сложные задачи с большей точностью, чем любая из предыдущих моделей, благодаря более широким общим знаниям и продвинутым возможностям рассуждения. GPT-4 доступен в OpenAI API для платных клиентов и оптимизирован для чата, так же как и gpt-3.5-turbo, но хорошо работает и для традиционных задач через API завершения чата. Узнайте, как использовать GPT-4 в нашем руководстве по генерации текста.

МОДЕЛЬКОНТЕКСТНОЕ ОКНОМАКС. ВЫХОДНЫЕ ТОКЕНЫТРЕНИРОВОЧНЫЕ ДАННЫЕ
gpt-4-turbo128,000 токенов4,096 токеновДо декабря 2023
gpt-4-turbo-2024-04-09128,000 токенов4,096 токеновДо декабря 2023
gpt-4-turbo-preview128,000 токенов4,096 токеновДо декабря 2023
gpt-4-0125-preview128,000 токенов4,096 токеновДо декабря 2023
gpt-4-1106-preview128,000 токенов4,096 токеновДо апреля 2023
gpt-48,192 токенов8,192 токеновДо сентября 2021
gpt-4-06138,192 токенов8,192 токеновДо сентября 2021

Многоязычные возможности

GPT-4 превосходит как предыдущие крупные языковые модели, так и большинство современных систем (которые часто имеют специфическую для модуля обучения или ручную настройку), по состоянию на 2023 год. На тесте MMLU, серия вопросов с множественным выбором на английском языке, охватывающая 57 тем, GPT-4 не только значительно превосходит существующие модели на английском, но и демонстрирует сильные результаты на других языках.

GPT-3.5 Turbo

Модели GPT-3.5 Turbo могут понимать и генерировать естественный язык или код и были оптимизированы для чата с использованием API завершения чата, но также работают хорошо для нечатовых задач.

По состоянию на июль 2024 года, вместо gpt-3.5-turbo следует использовать gpt-4o-mini, так как она дешевле, более способна, мультимодальна и работает с такой же скоростью. gpt-3.5-turbo все еще доступен для использования в API.

МОДЕЛЬКОНТЕКСТНОЕ ОКНОМАКС. ВЫХОДНЫЕ ТОКЕНЫТРЕНИРОВОЧНЫЕ ДАННЫЕ
gpt-3.5-turbo-012516,385 токенов4,096 токеновДо сентября 2021
gpt-3.5-turbo16,385 токенов4,096 токеновДо сентября 2021

DALL·E

DALL·E — это система ИИ, которая может создавать реалистичные изображения и искусство из описания на естественном языке. В данный момент DALL·E 3 поддерживает возможность создания нового изображения с определенным размером по запросу. DALL·E 2 также поддерживает возможность редактирования существующего изображения или создания вариаций изображения, предоставленного пользователем.

DALL·E 3 доступен через наш API изображений вместе с DALL·E 2. Вы можете попробовать DALL·E 3 через ChatGPT Plus.

МОДЕЛЬОПИСАНИЕ
dall-e-3Последняя модель DALL·E, выпущенная в ноябре 2023 года. Узнайте больше.
dall-e-2Предыдущая модель DALL·E, выпущенная в ноябре 2022 года. Вторая итерация DALL·E с более реалистичными, точными изображениями и 4x более высоким разрешением, чем оригинальная модель

TTS

TTS — это модель ИИ, преобразующая текст в естественно звучащий текст сообщения. Мы предлагаем два различных варианта модели: tts-1 оптимизирован для использования в режиме реального времени для преобразования текста в речь, и tts-1-hd оптимизирован для качества. Эти модели можно использовать с конечной точкой речи в API аудио.

МОДЕЛЬОПИСАНИЕ
tts-1Последняя модель преобразования текста в речь, оптимизированная для скорости.
tts-1-hdПоследняя модель преобразования текста в речь, оптимизированная для качества.

Whisper

Whisper — универсальная модель для распознавания речи. Обучена на большом наборе данных разнообразного аудио и также является мультимодельной, способной выполнять многоязычное распознавание речи, а также перевод и идентификацию языка. Модель Whisper v2-large доступна через наш API под именем whisper-1.

В настоящее время нет разницы между версией с открытым исходным кодом Whisper и версией, доступной через наш API. Однако через наш API мы предлагаем оптимизированный процесс вывода, что делает выполнение Whisper через наш API значительно быстрее, чем другими средствами. Для более технических сведений о Whisper прочитайте статью.

Embeddings

Embeddings — это числовое представление текста, которое можно использовать для измерения взаимосвязанности между двумя текстовыми фрагментами. Эмбеддинги полезны для поиска, кластеризации, рекомендаций, обнаружения аномалий и задач классификации. Вы можете узнать больше о наших последних моделях эмбеддинга в анонсовом посте в блоге.

МОДЕЛЬВЫХОДНОЕ ИЗМЕРЕНИЕ
text-embedding-3-largeСамая способная модель эмбеддинга для задач как на английском, так и на языках, отличных от английского. 3,072
text-embedding-3-smallУлучшенная производительность по сравнению с моделью 2-го поколения ada эмбеддинга. 1,536

Введение в модели модерации

Модели модерации разработаны для проверки соответствия контента политикам использования OpenAI. Эти модели обеспечивают возможности классификации, которые ищут контент в категориях, таких как ненависть, самоповреждение, сексуальный контент, насилие и другие. Узнайте больше о модерации текста и изображений в нашем руководстве по модерации.

Модели модерации и их характеристики

МодельМаксимальное количество токенов
omni-moderation-latestВ настоящее время указывает на omni-moderation-2024-09-26.
omni-moderation-2024-09-26Последняя закрепленная версия нашей новой многомодальной модели модерации, способной анализировать как текст, так и изображения.
text-moderation-latestВ настоящее время указывает на text-moderation-007.
text-moderation-stableВ настоящее время указывает на text-moderation-007.
text-moderation-007Модель предыдущего поколения, работающая только с текстом. Мы ожидаем, что модели серии omni-moderation-* будут лучшим вариантом по умолчанию в будущем.

Базовые модели GPT

Базовые модели GPT способны понимать и генерировать естественный язык или код, но не обучены следовать инструкциям. Эти модели разработаны для замены наших оригинальных базовых моделей GPT-3 и используют устаревший API Completions. Большинство клиентов должны использовать GPT-3.5 или GPT-4.

МодельМаксимальное количество токеновДанные обучения
babbage-00216,384До сентября 2021
davinci-00216,384До сентября 2021

Как мы используем ваши данные

Ваши данные — это ваши данные.

С 1 марта 2023 года данные, отправленные на API OpenAI, не будут использоваться для обучения или улучшения моделей OpenAI (если вы явно не согласились делиться данными с нами, например, предоставляя отзывы в Playground). Одним из преимуществ участия является то, что модели со временем могут стать лучше для вашего варианта использования.

В целях выявления злоупотреблений данные API могут храниться до 30 дней, после чего они будут удалены (если иное не требуется законом). Для надежных клиентов с чувствительными приложениями может быть доступна нулевая продолжительность хранения данных. При нулевом хранении данных тела запросов и ответов не сохраняются в каких-либо системах логирования и существуют только в памяти для обработки запроса.

Обратите внимание, что эта политика в отношении данных не распространяется на не-API потребительские сервисы OpenAI, такие как ChatGPT или DALL·E Labs.

Стандартные политики использования по конечным точкам

Конечная точкаДанные, используемые для обученияСтандартное хранениеВозможность нулевого хранения
/v1/chat/completions*Нет30 днейДа, кроме (a) изображений, (b) схем для структурированных выходов, (c) аудиовыходов.
/v1/assistantsНет30 дней **Нет
/v1/threadsНет30 дней **Нет
/v1/threads/messagesНет30 дней **Нет
/v1/threads/runsНет30 дней **Нет
/v1/vector_storesНет30 дней **Нет
/v1/threads/runs/stepsНет30 дней **Нет
/v1/images/generationsНет30 днейНет
/v1/images/editsНет30 днейНет
/v1/images/variationsНет30 днейНет
/v1/embeddingsНет30 днейДа
/v1/audio/transcriptionsНетНулевое хранение-
/v1/audio/translationsНетНулевое хранение-
/v1/audio/speechНет30 днейДа
/v1/filesНетДо удаления клиентомНет
/v1/fine_tuning/jobsНетДо удаления клиентомНет
/v1/batchesНетДо удаления клиентомНет
/v1/moderationsНетНулевое хранение-
/v1/completionsНет30 днейДа
/v1/realtime (beta)Нет30 днейНет

Дополнительные пояснения

  • Chat Completions:

    • Изображения, вводимые через модели gpt-4o, gpt-4o-mini, chatgpt-4o-latest или gpt-4-turbo (или ранее gpt-4-vision-preview), не подпадают под нулевое хранение.
    • Аудиовыходы хранятся в течение 1 часа для обеспечения возможности многократного ведения разговора и в настоящее время не подходят для нулевого хранения.
    • При включенных структурированных выходах предоставленные схемы (либо в формате ответа, либо в определении функции) не подходят для нулевого хранения, хотя сами завершения подходят.
    • При использовании сохраненных завершений через опцию store: true в API, эти завершения хранятся в течение 30 дней. Завершения хранятся в нефильтрованной форме после ответа API, поэтому избегайте хранения завершений с чувствительными данными.

** Assistants API:

  • Объекты, связанные с API Assistants, удаляются с наших серверов через 30 дней после их удаления через API или панель управления. Объекты, не удаленные через API или панель управления, хранятся бесконечно.

  • Оценочные данные: Когда вы создаете оценку, данные, связанные с этой оценкой, удаляются с наших серверов через 30 дней после удаления через панель управления. Оценочные данные, не удаленные через панель управления, хранятся бесконечно. Для получения подробностей ознакомьтесь с нашими политиками использования данных API. Чтобы узнать больше о нулевом хранении, свяжитесь с нашей торговой командой.

Совместимость конечных точек и моделей

Конечная точкаПоследние модели
/v1/assistantsВсе модели GPT-4o (кроме chatgpt-4o-latest), GPT-4o-mini, GPT-4 и GPT-3.5 Turbo. Инструмент поиска требует gpt-4-turbo-preview (и последующие версии моделей с датированием выпусков) или gpt-3.5-turbo-1106 (и последующие версии).
/v1/audio/transcriptionswhisper-1
/v1/audio/translationswhisper-1
/v1/audio/speechtts-1, tts-1-hd
/v1/chat/completionsВсе модели GPT-4o (кроме режима Realtime), GPT-4o-mini, GPT-4 и GPT-3.5 Turbo и их версии с датированием выпусков. динамическая модель chatgpt-4o-latest. Настроенные версии gpt-4o, gpt-4o-mini, gpt-4 и gpt-3.5-turbo.
/v1/completions (Legacy)gpt-3.5-turbo-instruct, babbage-002, davinci-002
/v1/embeddingstext-embedding-3-small, text-embedding-3-large, text-embedding-ada-002
/v1/fine_tuning/jobsgpt-4o, gpt-4o-mini, gpt-4, gpt-3.5-turbo
/v1/moderationstext-moderation-stable, text-moderation-latest
/v1/images/generationsdall-e-2, dall-e-3
/v1/realtime (beta)gpt-4o-realtime-preview, gpt-4o-realtime-preview-2024-10-01

Создано при поддержке AITUNNEL