Обзор моделей

OpenAI предлагает широкий выбор моделей для различных задач. Полный каталог доступных моделей с подробными характеристиками можно посмотреть на странице моделей. Для сравнения производительности и стоимости разных моделей используйте наш инструмент сравнения.

Основные модели

GPT-4o

Наш флагманский интеллектуальный образец для сложных многошаговых задач.

Ввод текста и изображений, вывод текста
Контекстная длина 128k
Умнее модель, выше цена за токен

GPT-4o mini

Доступная и умная мини-модель для быстрых и нетрудоёмких задач.

Ввод текста и изображений, вывод текста
Контекстная длина 128k
Быстрая модель, низкая цена за токен

o1-preview и o1-mini (beta)

Новая серия моделей рассуждения для решения сложных задач.

Ввод текста, вывод текста
Контекстная длина 128k
Высокая задержка, использует токены для мышления

Детали о ценах моделей

Обзор моделей

OpenAI API работает на основе различных моделей с различными возможностями и точками цены. Вы также можете настроить наши модели под ваши нужды с помощью тонкой настройки.

МОДЕЛЬ	ОПИСАНИЕ
GPT-4o	Наш флагманский интеллектуальный образец для сложных многошаговых задач
GPT-4o mini	Наша доступная и умная малогабаритная модель для быстрых, нетрудоёмких задач
o1-preview и o1-mini	Лингвистические модели, обученные с помощью обучения с подкреплением для выполнения сложных задач
GPT-4 Turbo и GPT-4	Предыдущий набор высокоинтеллектуальных моделей
GPT-3.5 Turbo	Быстрая, недорогая модель для простых задач
DALL·E	Модель для генерации и редактирования изображений на основе текстового описания
TTS	Набор моделей, преобразующих текст в естественное звучание аудио речи
Whisper	Модель, преобразующая аудио в текст
Embeddings	Набор моделей, преобразующих текст в числовую форму
Moderation	Настроенная модель, обнаруживающего потенциально чувствительный или небезопасный текст
Устаревшие	Полный список устаревших моделей вместе с рекомендованной заменой

Для моделей серии GPT, контекстное окно относится к максимальному числу токенов, которые могут быть использованы в одном запросе, включая как входные, так и выходные токены.

Мы также опубликовали модели с открытым исходным кодом, включая Point-E, Whisper, Jukebox и CLIP.

Непрерывные обновления моделей

gpt-4o, gpt-4o-mini, gpt-4-turbo, gpt-4 и gpt-3.5-turbo указывают на свои соответствующие последние версии моделей. Вы можете проверить это, обратившись к объекту ответа после отправки запроса. Ответ включает версию модели, использованную в запросе (например, gpt-3.5-turbo-1106). Модель chatgpt-4o-latest постоянно указывает на версию GPT-4o, используемую в ChatGPT, и часто обновляется при значительных изменениях. За исключением chatgpt-4o-latest, мы предлагаем закрепленные версии моделей, которые разработчики могут продолжать использовать минимум три месяца после внедрения обновлённой модели.

Узнайте больше о снятии моделей на нашей странице снятия с производства.

GPT-4o

GPT-4o («o» для «omni») — наша самая продвинутая модель GPT. Это мультимодальная модель (принимает текст или изображение и выводит текст) с такой же высокой степенью интеллекта, как GPT-4 Turbo, но более эффективна — она генерирует текст в 2 раза быстрее и стоит на 50% дешевле. Кроме того, GPT-4o обладает лучшим зрением и производительностью на других языках, кроме английского, чем любая из наших моделей. GPT-4o доступен в OpenAI API для платных клиентов. Узнайте, как использовать GPT-4o в нашем руководстве по генерации текста.

МОДЕЛЬ	КОНТЕКСТНОЕ ОКНО	МАКС. ВЫХОДНЫЕ ТОКЕНЫ	ТРЕНИРОВОЧНЫЕ ДАННЫЕ
gpt-4o	128,000 токенов	16,384 токенов	До октября 2023
gpt-4o-2024-08-06	128,000 токенов	16,384 токенов	До октября 2023
gpt-4o-2024-05-13	128,000 токенов	4,096 токенов	До октября 2023
chatgpt-4o-latest	128,000 токенов	16,384 токенов	До октября 2023

GPT-4o mini

GPT-4o mini («o» для «omni») — наша самая продвинутая в категории малых моделей и самая дешевая модель на данный момент. Это мультимодальная модель (принимает текст или изображение и выводит текст), имеет более высокий уровень интеллекта, чем gpt-3.5-turbo, но работает с такой же скоростью. Она предназначена для выполнения более мелких задач, включая задачи с визуальными возможностями.

Мы рекомендуем использовать gpt-4o-mini, где ранее использовалась gpt-3.5-turbo, так как эта модель более способна и дешевле.

МОДЕЛЬ	КОНТЕКСТНОЕ ОКНО	МАКС. ВЫХОДНЫЕ ТОКЕНЫ	ТРЕНИРОВОЧНЫЕ ДАННЫЕ
gpt-4o-mini	128,000 токенов	16,384 токенов	До октября 2023
gpt-4o-mini-2024-07-18	128,000 токенов	16,384 токенов	До октября 2023

GPT-4o Realtime + Audio Beta

Это предварительный выпуск моделей GPT-4o Realtime и Audio. Модели gpt-4o-realtime-* способны отвечать на аудио и текстовые входные данные через интерфейс WebSocket. Узнайте больше в руководстве по Realtime API. Модели gpt-4o-audio-* ниже можно использовать в Chat Completions для генерации аудиорежимов.

МОДЕЛЬ	КОНТЕКСТНОЕ ОКНО	МАКС. ВЫХОДНЫЕ ТОКЕНЫ	ТРЕНИРОВОЧНЫЕ ДАННЫЕ
gpt-4o-realtime-preview	128,000 токенов	4,096 токенов	До октября 2023
gpt-4o-realtime-preview-2024-10-01	128,000 токенов	4,096 токенов	До октября 2023
gpt-4o-audio-preview	128,000 токенов	16,384 токенов	До октября 2023
gpt-4o-audio-preview-2024-10-01	128,000 токенов	16,384 токенов	До октября 2023

o1-preview и o1-mini Beta

Серия больших языковых моделей o1 обучается с подкреплением для выполнения сложных рассуждений. Модели o1 обдумывают перед ответом, создавая длинную внутреннюю цепочку рассуждений перед тем, как ответить пользователю. Узнайте о возможностях и ограничениях моделей o1 в нашем руководстве по рассуждению.

Доступны два типа моделей:

o1-preview: модель рассуждения, предназначенная для решения сложных задач в разных областях.
o1-mini: более быстрая и дешевая модель рассуждения, особенно хорошая в программировании, математике и науке.

МОДЕЛЬ	КОНТЕКСТНОЕ ОКНО	МАКС. ВЫХОДНЫЕ ТОКЕНЫ	ТРЕНИРОВОЧНЫЕ ДАННЫЕ
o1-preview	128,000 токенов	32,768 токенов	До октября 2023
o1-preview-2024-09-12	128,000 токенов	32,768 токенов	До октября 2023
o1-mini	128,000 токенов	65,536 токенов	До октября 2023
o1-mini-2024-09-12	128,000 токенов	65,536 токенов	До октября 2023

GPT-4 Turbo и GPT-4

GPT-4 — это крупная мультимодальная модель (принимает текст или изображение и выводит текст), способная решать сложные задачи с большей точностью, чем любая из предыдущих моделей, благодаря более широким общим знаниям и продвинутым возможностям рассуждения. GPT-4 доступен в OpenAI API для платных клиентов и оптимизирован для чата, так же как и gpt-3.5-turbo, но хорошо работает и для традиционных задач через API завершения чата. Узнайте, как использовать GPT-4 в нашем руководстве по генерации текста.

МОДЕЛЬ	КОНТЕКСТНОЕ ОКНО	МАКС. ВЫХОДНЫЕ ТОКЕНЫ	ТРЕНИРОВОЧНЫЕ ДАННЫЕ
gpt-4-turbo	128,000 токенов	4,096 токенов	До декабря 2023
gpt-4-turbo-2024-04-09	128,000 токенов	4,096 токенов	До декабря 2023
gpt-4-turbo-preview	128,000 токенов	4,096 токенов	До декабря 2023
gpt-4-0125-preview	128,000 токенов	4,096 токенов	До декабря 2023
gpt-4-1106-preview	128,000 токенов	4,096 токенов	До апреля 2023
gpt-4	8,192 токенов	8,192 токенов	До сентября 2021
gpt-4-0613	8,192 токенов	8,192 токенов	До сентября 2021

Многоязычные возможности

GPT-4 превосходит как предыдущие крупные языковые модели, так и большинство современных систем (которые часто имеют специфическую для модуля обучения или ручную настройку), по состоянию на 2023 год. На тесте MMLU, серия вопросов с множественным выбором на английском языке, охватывающая 57 тем, GPT-4 не только значительно превосходит существующие модели на английском, но и демонстрирует сильные результаты на других языках.

GPT-3.5 Turbo

Модели GPT-3.5 Turbo могут понимать и генерировать естественный язык или код и были оптимизированы для чата с использованием API завершения чата, но также работают хорошо для нечатовых задач.

По состоянию на июль 2024 года, вместо gpt-3.5-turbo следует использовать gpt-4o-mini, так как она дешевле, более способна, мультимодальна и работает с такой же скоростью. gpt-3.5-turbo все еще доступен для использования в API.

МОДЕЛЬ	КОНТЕКСТНОЕ ОКНО	МАКС. ВЫХОДНЫЕ ТОКЕНЫ	ТРЕНИРОВОЧНЫЕ ДАННЫЕ
gpt-3.5-turbo-0125	16,385 токенов	4,096 токенов	До сентября 2021
gpt-3.5-turbo	16,385 токенов	4,096 токенов	До сентября 2021

DALL·E

DALL·E — это система ИИ, которая может создавать реалистичные изображения и искусство из описания на естественном языке. В данный момент DALL·E 3 поддерживает возможность создания нового изображения с определенным размером по запросу. DALL·E 2 также поддерживает возможность редактирования существующего изображения или создания вариаций изображения, предоставленного пользователем.

DALL·E 3 доступен через наш API изображений вместе с DALL·E 2. Вы можете попробовать DALL·E 3 через ChatGPT Plus.

МОДЕЛЬ	ОПИСАНИЕ
dall-e-3	Последняя модель DALL·E, выпущенная в ноябре 2023 года. Узнайте больше.
dall-e-2	Предыдущая модель DALL·E, выпущенная в ноябре 2022 года. Вторая итерация DALL·E с более реалистичными, точными изображениями и 4x более высоким разрешением, чем оригинальная модель

TTS

TTS — это модель ИИ, преобразующая текст в естественно звучащий текст сообщения. Мы предлагаем два различных варианта модели: tts-1 оптимизирован для использования в режиме реального времени для преобразования текста в речь, и tts-1-hd оптимизирован для качества. Эти модели можно использовать с конечной точкой речи в API аудио.

МОДЕЛЬ	ОПИСАНИЕ
tts-1	Последняя модель преобразования текста в речь, оптимизированная для скорости.
tts-1-hd	Последняя модель преобразования текста в речь, оптимизированная для качества.

Whisper

Whisper — универсальная модель для распознавания речи. Обучена на большом наборе данных разнообразного аудио и также является мультимодельной, способной выполнять многоязычное распознавание речи, а также перевод и идентификацию языка. Модель Whisper v2-large доступна через наш API под именем whisper-1.

В настоящее время нет разницы между версией с открытым исходным кодом Whisper и версией, доступной через наш API. Однако через наш API мы предлагаем оптимизированный процесс вывода, что делает выполнение Whisper через наш API значительно быстрее, чем другими средствами. Для более технических сведений о Whisper прочитайте статью.

Embeddings

Embeddings — это числовое представление текста, которое можно использовать для измерения взаимосвязанности между двумя текстовыми фрагментами. Эмбеддинги полезны для поиска, кластеризации, рекомендаций, обнаружения аномалий и задач классификации. Вы можете узнать больше о наших последних моделях эмбеддинга в анонсовом посте в блоге.

МОДЕЛЬ	ВЫХОДНОЕ ИЗМЕРЕНИЕ
text-embedding-3-large	Самая способная модель эмбеддинга для задач как на английском, так и на языках, отличных от английского. 3,072
text-embedding-3-small	Улучшенная производительность по сравнению с моделью 2-го поколения ada эмбеддинга. 1,536

Введение в модели модерации

Модели модерации разработаны для проверки соответствия контента политикам использования OpenAI. Эти модели обеспечивают возможности классификации, которые ищут контент в категориях, таких как ненависть, самоповреждение, сексуальный контент, насилие и другие. Узнайте больше о модерации текста и изображений в нашем руководстве по модерации.

Модели модерации и их характеристики

Модель	Максимальное количество токенов
omni-moderation-latest	В настоящее время указывает на omni-moderation-2024-09-26.

omni-moderation-2024-09-26	Последняя закрепленная версия нашей новой многомодальной модели модерации, способной анализировать как текст, так и изображения.

text-moderation-latest	В настоящее время указывает на text-moderation-007.

text-moderation-stable	В настоящее время указывает на text-moderation-007.

text-moderation-007	Модель предыдущего поколения, работающая только с текстом. Мы ожидаем, что модели серии omni-moderation-* будут лучшим вариантом по умолчанию в будущем.

Базовые модели GPT

Базовые модели GPT способны понимать и генерировать естественный язык или код, но не обучены следовать инструкциям. Эти модели разработаны для замены наших оригинальных базовых моделей GPT-3 и используют устаревший API Completions. Большинство клиентов должны использовать GPT-3.5 или GPT-4.

Модель	Максимальное количество токенов	Данные обучения
babbage-002	16,384	До сентября 2021
davinci-002	16,384	До сентября 2021

Как мы используем ваши данные

Ваши данные — это ваши данные.

С 1 марта 2023 года данные, отправленные на API OpenAI, не будут использоваться для обучения или улучшения моделей OpenAI (если вы явно не согласились делиться данными с нами, например, предоставляя отзывы в Playground). Одним из преимуществ участия является то, что модели со временем могут стать лучше для вашего варианта использования.

В целях выявления злоупотреблений данные API могут храниться до 30 дней, после чего они будут удалены (если иное не требуется законом). Для надежных клиентов с чувствительными приложениями может быть доступна нулевая продолжительность хранения данных. При нулевом хранении данных тела запросов и ответов не сохраняются в каких-либо системах логирования и существуют только в памяти для обработки запроса.

Обратите внимание, что эта политика в отношении данных не распространяется на не-API потребительские сервисы OpenAI, такие как ChatGPT или DALL·E Labs.

Стандартные политики использования по конечным точкам

Конечная точка	Данные, используемые для обучения	Стандартное хранение	Возможность нулевого хранения
/v1/chat/completions*	Нет	30 дней	Да, кроме (a) изображений, (b) схем для структурированных выходов, (c) аудиовыходов.
/v1/assistants	Нет	30 дней **	Нет
/v1/threads	Нет	30 дней **	Нет
/v1/threads/messages	Нет	30 дней **	Нет
/v1/threads/runs	Нет	30 дней **	Нет
/v1/vector_stores	Нет	30 дней **	Нет
/v1/threads/runs/steps	Нет	30 дней **	Нет
/v1/images/generations	Нет	30 дней	Нет
/v1/images/edits	Нет	30 дней	Нет
/v1/images/variations	Нет	30 дней	Нет
/v1/embeddings	Нет	30 дней	Да
/v1/audio/transcriptions	Нет	Нулевое хранение	-
/v1/audio/translations	Нет	Нулевое хранение	-
/v1/audio/speech	Нет	30 дней	Да
/v1/files	Нет	До удаления клиентом	Нет
/v1/fine_tuning/jobs	Нет	До удаления клиентом	Нет
/v1/batches	Нет	До удаления клиентом	Нет
/v1/moderations	Нет	Нулевое хранение	-
/v1/completions	Нет	30 дней	Да
/v1/realtime (beta)	Нет	30 дней	Нет

Дополнительные пояснения

Chat Completions:
- Изображения, вводимые через модели gpt-4o, gpt-4o-mini, chatgpt-4o-latest или gpt-4-turbo (или ранее gpt-4-vision-preview), не подпадают под нулевое хранение.
- Аудиовыходы хранятся в течение 1 часа для обеспечения возможности многократного ведения разговора и в настоящее время не подходят для нулевого хранения.
- При включенных структурированных выходах предоставленные схемы (либо в формате ответа, либо в определении функции) не подходят для нулевого хранения, хотя сами завершения подходят.
- При использовании сохраненных завершений через опцию store: true в API, эти завершения хранятся в течение 30 дней. Завершения хранятся в нефильтрованной форме после ответа API, поэтому избегайте хранения завершений с чувствительными данными.

** Assistants API:

Объекты, связанные с API Assistants, удаляются с наших серверов через 30 дней после их удаления через API или панель управления. Объекты, не удаленные через API или панель управления, хранятся бесконечно.
Оценочные данные: Когда вы создаете оценку, данные, связанные с этой оценкой, удаляются с наших серверов через 30 дней после удаления через панель управления. Оценочные данные, не удаленные через панель управления, хранятся бесконечно. Для получения подробностей ознакомьтесь с нашими политиками использования данных API. Чтобы узнать больше о нулевом хранении, свяжитесь с нашей торговой командой.

Совместимость конечных точек и моделей

Конечная точка	Последние модели
/v1/assistants	Все модели GPT-4o (кроме chatgpt-4o-latest), GPT-4o-mini, GPT-4 и GPT-3.5 Turbo. Инструмент поиска требует gpt-4-turbo-preview (и последующие версии моделей с датированием выпусков) или gpt-3.5-turbo-1106 (и последующие версии).
/v1/audio/transcriptions	whisper-1
/v1/audio/translations	whisper-1
/v1/audio/speech	tts-1, tts-1-hd
/v1/chat/completions	Все модели GPT-4o (кроме режима Realtime), GPT-4o-mini, GPT-4 и GPT-3.5 Turbo и их версии с датированием выпусков. динамическая модель chatgpt-4o-latest. Настроенные версии gpt-4o, gpt-4o-mini, gpt-4 и gpt-3.5-turbo.
/v1/completions (Legacy)	gpt-3.5-turbo-instruct, babbage-002, davinci-002
/v1/embeddings	text-embedding-3-small, text-embedding-3-large, text-embedding-ada-002
/v1/fine_tuning/jobs	gpt-4o, gpt-4o-mini, gpt-4, gpt-3.5-turbo
/v1/moderations	text-moderation-stable, text-moderation-latest
/v1/images/generations	dall-e-2, dall-e-3
/v1/realtime (beta)	gpt-4o-realtime-preview, gpt-4o-realtime-preview-2024-10-01

Обзор моделей ​

Основные модели ​

GPT-4o ​

GPT-4o mini ​

o1-preview и o1-mini (beta) ​

Детали о ценах моделей ​

Обзор моделей ​

Непрерывные обновления моделей ​

GPT-4o ​

GPT-4o mini ​

GPT-4o Realtime + Audio Beta ​

o1-preview и o1-mini Beta ​

GPT-4 Turbo и GPT-4 ​

Многоязычные возможности ​

GPT-3.5 Turbo ​

DALL·E ​

TTS ​

Whisper ​

Embeddings ​

Введение в модели модерации ​

Модели модерации и их характеристики ​

Базовые модели GPT ​

Как мы используем ваши данные ​

Стандартные политики использования по конечным точкам ​

Дополнительные пояснения ​

Совместимость конечных точек и моделей ​

Обзор моделей

Основные модели

GPT-4o

GPT-4o mini

o1-preview и o1-mini (beta)

Детали о ценах моделей

Обзор моделей

Непрерывные обновления моделей

GPT-4o

GPT-4o mini

GPT-4o Realtime + Audio Beta

o1-preview и o1-mini Beta

GPT-4 Turbo и GPT-4

Многоязычные возможности

GPT-3.5 Turbo

DALL·E

TTS

Whisper

Embeddings

Введение в модели модерации

Модели модерации и их характеристики

Базовые модели GPT

Как мы используем ваши данные

Стандартные политики использования по конечным точкам

Дополнительные пояснения

Совместимость конечных точек и моделей