Обзор моделей
Основные модели
GPT-4o
Наш флагманский интеллектуальный образец для сложных многошаговых задач.
- Ввод текста и изображений, вывод текста
- Контекстная длина 128k
- Умнее модель, выше цена за токен
GPT-4o mini
Доступная и умная мини-модель для быстрых и нетрудоёмких задач.
- Ввод текста и изображений, вывод текста
- Контекстная длина 128k
- Быстрая модель, низкая цена за токен
o1-preview и o1-mini (beta)
Новая серия моделей рассуждения для решения сложных задач.
- Ввод текста, вывод текста
- Контекстная длина 128k
- Высокая задержка, использует токены для мышления
Детали о ценах моделей
Обзор моделей
OpenAI API работает на основе различных моделей с различными возможностями и точками цены. Вы также можете настроить наши модели под ваши нужды с помощью тонкой настройки.
МОДЕЛЬ | ОПИСАНИЕ |
---|---|
GPT-4o | Наш флагманский интеллектуальный образец для сложных многошаговых задач |
GPT-4o mini | Наша доступная и умная малогабаритная модель для быстрых, нетрудоёмких задач |
o1-preview и o1-mini | Лингвистические модели, обученные с помощью обучения с подкреплением для выполнения сложных задач |
GPT-4 Turbo и GPT-4 | Предыдущий набор высокоинтеллектуальных моделей |
GPT-3.5 Turbo | Быстрая, недорогая модель для простых задач |
DALL·E | Модель для генерации и редактирования изображений на основе текстового описания |
TTS | Набор моделей, преобразующих текст в естественное звучание аудио речи |
Whisper | Модель, преобразующая аудио в текст |
Embeddings | Набор моделей, преобразующих текст в числовую форму |
Moderation | Настроенная модель, обнаруживающего потенциально чувствительный или небезопасный текст |
Устаревшие | Полный список устаревших моделей вместе с рекомендованной заменой |
Для моделей серии GPT, контекстное окно относится к максимальному числу токенов, которые могут быть использованы в одном запросе, включая как входные, так и выходные токены.
Мы также опубликовали модели с открытым исходным кодом, включая Point-E, Whisper, Jukebox и CLIP.
Непрерывные обновления моделей
gpt-4o, gpt-4o-mini, gpt-4-turbo, gpt-4 и gpt-3.5-turbo указывают на свои соответствующие последние версии моделей. Вы можете проверить это, обратившись к объекту ответа после отправки запроса. Ответ включает версию модели, использованную в запросе (например, gpt-3.5-turbo-1106). Модель chatgpt-4o-latest постоянно указывает на версию GPT-4o, используемую в ChatGPT, и часто обновляется при значительных изменениях. За исключением chatgpt-4o-latest, мы предлагаем закрепленные версии моделей, которые разработчики могут продолжать использовать минимум три месяца после внедрения обновлённой модели.
Узнайте больше о снятии моделей на нашей странице снятия с производства.
GPT-4o
GPT-4o («o» для «omni») — наша самая продвинутая модель GPT. Это мультимодальная модель (принимает текст или изображение и выводит текст) с такой же высокой степенью интеллекта, как GPT-4 Turbo, но более эффективна — она генерирует текст в 2 раза быстрее и стоит на 50% дешевле. Кроме того, GPT-4o обладает лучшим зрением и производительностью на других языках, кроме английского, чем любая из наших моделей. GPT-4o доступен в OpenAI API для платных клиентов. Узнайте, как использовать GPT-4o в нашем руководстве по генерации текста.
МОДЕЛЬ | КОНТЕКСТНОЕ ОКНО | МАКС. ВЫХОДНЫЕ ТОКЕНЫ | ТРЕНИРОВОЧНЫЕ ДАННЫЕ |
---|---|---|---|
gpt-4o | 128,000 токенов | 16,384 токенов | До октября 2023 |
gpt-4o-2024-08-06 | 128,000 токенов | 16,384 токенов | До октября 2023 |
gpt-4o-2024-05-13 | 128,000 токенов | 4,096 токенов | До октября 2023 |
chatgpt-4o-latest | 128,000 токенов | 16,384 токенов | До октября 2023 |
GPT-4o mini
GPT-4o mini («o» для «omni») — наша самая продвинутая в категории малых моделей и самая дешевая модель на данный момент. Это мультимодальная модель (принимает текст или изображение и выводит текст), имеет более высокий уровень интеллекта, чем gpt-3.5-turbo, но работает с такой же скоростью. Она предназначена для выполнения более мелких задач, включая задачи с визуальными возможностями.
Мы рекомендуем использовать gpt-4o-mini, где ранее использовалась gpt-3.5-turbo, так как эта модель более способна и дешевле.
МОДЕЛЬ | КОНТЕКСТНОЕ ОКНО | МАКС. ВЫХОДНЫЕ ТОКЕНЫ | ТРЕНИРОВОЧНЫЕ ДАННЫЕ |
---|---|---|---|
gpt-4o-mini | 128,000 токенов | 16,384 токенов | До октября 2023 |
gpt-4o-mini-2024-07-18 | 128,000 токенов | 16,384 токенов | До октября 2023 |
GPT-4o Realtime + Audio Beta
Это предварительный выпуск моделей GPT-4o Realtime и Audio. Модели gpt-4o-realtime-* способны отвечать на аудио и текстовые входные данные через интерфейс WebSocket. Узнайте больше в руководстве по Realtime API. Модели gpt-4o-audio-* ниже можно использовать в Chat Completions для генерации аудиорежимов.
МОДЕЛЬ | КОНТЕКСТНОЕ ОКНО | МАКС. ВЫХОДНЫЕ ТОКЕНЫ | ТРЕНИРОВОЧНЫЕ ДАННЫЕ |
---|---|---|---|
gpt-4o-realtime-preview | 128,000 токенов | 4,096 токенов | До октября 2023 |
gpt-4o-realtime-preview-2024-10-01 | 128,000 токенов | 4,096 токенов | До октября 2023 |
gpt-4o-audio-preview | 128,000 токенов | 16,384 токенов | До октября 2023 |
gpt-4o-audio-preview-2024-10-01 | 128,000 токенов | 16,384 токенов | До октября 2023 |
o1-preview и o1-mini Beta
Серия больших языковых моделей o1 обучается с подкреплением для выполнения сложных рассуждений. Модели o1 обдумывают перед ответом, создавая длинную внутреннюю цепочку рассуждений перед тем, как ответить пользователю. Узнайте о возможностях и ограничениях моделей o1 в нашем руководстве по рассуждению.
Доступны два типа моделей:
- o1-preview: модель рассуждения, предназначенная для решения сложных задач в разных областях.
- o1-mini: более быстрая и дешевая модель рассуждения, особенно хорошая в программировании, математике и науке.
МОДЕЛЬ | КОНТЕКСТНОЕ ОКНО | МАКС. ВЫХОДНЫЕ ТОКЕНЫ | ТРЕНИРОВОЧНЫЕ ДАННЫЕ |
---|---|---|---|
o1-preview | 128,000 токенов | 32,768 токенов | До октября 2023 |
o1-preview-2024-09-12 | 128,000 токенов | 32,768 токенов | До октября 2023 |
o1-mini | 128,000 токенов | 65,536 токенов | До октября 2023 |
o1-mini-2024-09-12 | 128,000 токенов | 65,536 токенов | До октября 2023 |
GPT-4 Turbo и GPT-4
GPT-4 — это крупная мультимодальная модель (принимает текст или изображение и выводит текст), способная решать сложные задачи с большей точностью, чем любая из предыдущих моделей, благодаря более широким общим знаниям и продвинутым возможностям рассуждения. GPT-4 доступен в OpenAI API для платных клиентов и оптимизирован для чата, так же как и gpt-3.5-turbo, но хорошо работает и для традиционных задач через API завершения чата. Узнайте, как использовать GPT-4 в нашем руководстве по генерации текста.
МОДЕЛЬ | КОНТЕКСТНОЕ ОКНО | МАКС. ВЫХОДНЫЕ ТОКЕНЫ | ТРЕНИРОВОЧНЫЕ ДАННЫЕ |
---|---|---|---|
gpt-4-turbo | 128,000 токенов | 4,096 токенов | До декабря 2023 |
gpt-4-turbo-2024-04-09 | 128,000 токенов | 4,096 токенов | До декабря 2023 |
gpt-4-turbo-preview | 128,000 токенов | 4,096 токенов | До декабря 2023 |
gpt-4-0125-preview | 128,000 токенов | 4,096 токенов | До декабря 2023 |
gpt-4-1106-preview | 128,000 токенов | 4,096 токенов | До апреля 2023 |
gpt-4 | 8,192 токенов | 8,192 токенов | До сентября 2021 |
gpt-4-0613 | 8,192 токенов | 8,192 токенов | До сентября 2021 |
Многоязычные возможности
GPT-4 превосходит как предыдущие крупные языковые модели, так и большинство современных систем (которые часто имеют специфическую для модуля обучения или ручную настройку), по состоянию на 2023 год. На тесте MMLU, серия вопросов с множественным выбором на английском языке, охватывающая 57 тем, GPT-4 не только значительно превосходит существующие модели на английском, но и демонстрирует сильные результаты на других языках.
GPT-3.5 Turbo
Модели GPT-3.5 Turbo могут понимать и генерировать естественный язык или код и были оптимизированы для чата с использованием API завершения чата, но также работают хорошо для нечатовых задач.
По состоянию на июль 2024 года, вместо gpt-3.5-turbo следует использовать gpt-4o-mini, так как она дешевле, более способна, мультимодальна и работает с такой же скоростью. gpt-3.5-turbo все еще доступен для использования в API.
МОДЕЛЬ | КОНТЕКСТНОЕ ОКНО | МАКС. ВЫХОДНЫЕ ТОКЕНЫ | ТРЕНИРОВОЧНЫЕ ДАННЫЕ |
---|---|---|---|
gpt-3.5-turbo-0125 | 16,385 токенов | 4,096 токенов | До сентября 2021 |
gpt-3.5-turbo | 16,385 токенов | 4,096 токенов | До сентября 2021 |
DALL·E
DALL·E — это система ИИ, которая может создавать реалистичные изображения и искусство из описания на естественном языке. В данный момент DALL·E 3 поддерживает возможность создания нового изображения с определенным размером по запросу. DALL·E 2 также поддерживает возможность редактирования существующего изображения или создания вариаций изображения, предоставленного пользователем.
DALL·E 3 доступен через наш API изображений вместе с DALL·E 2. Вы можете попробовать DALL·E 3 через ChatGPT Plus.
МОДЕЛЬ | ОПИСАНИЕ |
---|---|
dall-e-3 | Последняя модель DALL·E, выпущенная в ноябре 2023 года. Узнайте больше. |
dall-e-2 | Предыдущая модель DALL·E, выпущенная в ноябре 2022 года. Вторая итерация DALL·E с более реалистичными, точными изображениями и 4x более высоким разрешением, чем оригинальная модель |
TTS
TTS — это модель ИИ, преобразующая текст в естественно звучащий текст сообщения. Мы предлагаем два различных варианта модели: tts-1 оптимизирован для использования в режиме реального времени для преобразования текста в речь, и tts-1-hd оптимизирован для качества. Эти модели можно использовать с конечной точкой речи в API аудио.
МОДЕЛЬ | ОПИСАНИЕ |
---|---|
tts-1 | Последняя модель преобразования текста в речь, оптимизированная для скорости. |
tts-1-hd | Последняя модель преобразования текста в речь, оптимизированная для качества. |
Whisper
Whisper — универсальная модель для распознавания речи. Обучена на большом наборе данных разнообразного аудио и также является мультимодельной, способной выполнять многоязычное распознавание речи, а также перевод и идентификацию языка. Модель Whisper v2-large доступна через наш API под именем whisper-1.
В настоящее время нет разницы между версией с открытым исходным кодом Whisper и версией, доступной через наш API. Однако через наш API мы предлагаем оптимизированный процесс вывода, что делает выполнение Whisper через наш API значительно быстрее, чем другими средствами. Для более технических сведений о Whisper прочитайте статью.
Embeddings
Embeddings — это числовое представление текста, которое можно использовать для измерения взаимосвязанности между двумя текстовыми фрагментами. Эмбеддинги полезны для поиска, кластеризации, рекомендаций, обнаружения аномалий и задач классификации. Вы можете узнать больше о наших последних моделях эмбеддинга в анонсовом посте в блоге.
МОДЕЛЬ | ВЫХОДНОЕ ИЗМЕРЕНИЕ |
---|---|
text-embedding-3-large | Самая способная модель эмбеддинга для задач как на английском, так и на языках, отличных от английского. 3,072 |
text-embedding-3-small | Улучшенная производительность по сравнению с моделью 2-го поколения ada эмбеддинга. 1,536 |
Введение в модели модерации
Модели модерации разработаны для проверки соответствия контента политикам использования OpenAI. Эти модели обеспечивают возможности классификации, которые ищут контент в категориях, таких как ненависть, самоповреждение, сексуальный контент, насилие и другие. Узнайте больше о модерации текста и изображений в нашем руководстве по модерации.
Модели модерации и их характеристики
Модель | Максимальное количество токенов |
---|---|
omni-moderation-latest | В настоящее время указывает на omni-moderation-2024-09-26. |
omni-moderation-2024-09-26 | Последняя закрепленная версия нашей новой многомодальной модели модерации, способной анализировать как текст, так и изображения. |
text-moderation-latest | В настоящее время указывает на text-moderation-007. |
text-moderation-stable | В настоящее время указывает на text-moderation-007. |
text-moderation-007 | Модель предыдущего поколения, работающая только с текстом. Мы ожидаем, что модели серии omni-moderation-* будут лучшим вариантом по умолчанию в будущем. |
Базовые модели GPT
Базовые модели GPT способны понимать и генерировать естественный язык или код, но не обучены следовать инструкциям. Эти модели разработаны для замены наших оригинальных базовых моделей GPT-3 и используют устаревший API Completions. Большинство клиентов должны использовать GPT-3.5 или GPT-4.
Модель | Максимальное количество токенов | Данные обучения |
---|---|---|
babbage-002 | 16,384 | До сентября 2021 |
davinci-002 | 16,384 | До сентября 2021 |
Как мы используем ваши данные
Ваши данные — это ваши данные.
С 1 марта 2023 года данные, отправленные на API OpenAI, не будут использоваться для обучения или улучшения моделей OpenAI (если вы явно не согласились делиться данными с нами, например, предоставляя отзывы в Playground). Одним из преимуществ участия является то, что модели со временем могут стать лучше для вашего варианта использования.
В целях выявления злоупотреблений данные API могут храниться до 30 дней, после чего они будут удалены (если иное не требуется законом). Для надежных клиентов с чувствительными приложениями может быть доступна нулевая продолжительность хранения данных. При нулевом хранении данных тела запросов и ответов не сохраняются в каких-либо системах логирования и существуют только в памяти для обработки запроса.
Обратите внимание, что эта политика в отношении данных не распространяется на не-API потребительские сервисы OpenAI, такие как ChatGPT или DALL·E Labs.
Стандартные политики использования по конечным точкам
Конечная точка | Данные, используемые для обучения | Стандартное хранение | Возможность нулевого хранения |
---|---|---|---|
/v1/chat/completions* | Нет | 30 дней | Да, кроме (a) изображений, (b) схем для структурированных выходов, (c) аудиовыходов. |
/v1/assistants | Нет | 30 дней ** | Нет |
/v1/threads | Нет | 30 дней ** | Нет |
/v1/threads/messages | Нет | 30 дней ** | Нет |
/v1/threads/runs | Нет | 30 дней ** | Нет |
/v1/vector_stores | Нет | 30 дней ** | Нет |
/v1/threads/runs/steps | Нет | 30 дней ** | Нет |
/v1/images/generations | Нет | 30 дней | Нет |
/v1/images/edits | Нет | 30 дней | Нет |
/v1/images/variations | Нет | 30 дней | Нет |
/v1/embeddings | Нет | 30 дней | Да |
/v1/audio/transcriptions | Нет | Нулевое хранение | - |
/v1/audio/translations | Нет | Нулевое хранение | - |
/v1/audio/speech | Нет | 30 дней | Да |
/v1/files | Нет | До удаления клиентом | Нет |
/v1/fine_tuning/jobs | Нет | До удаления клиентом | Нет |
/v1/batches | Нет | До удаления клиентом | Нет |
/v1/moderations | Нет | Нулевое хранение | - |
/v1/completions | Нет | 30 дней | Да |
/v1/realtime (beta) | Нет | 30 дней | Нет |
Дополнительные пояснения
Chat Completions:
- Изображения, вводимые через модели gpt-4o, gpt-4o-mini, chatgpt-4o-latest или gpt-4-turbo (или ранее gpt-4-vision-preview), не подпадают под нулевое хранение.
- Аудиовыходы хранятся в течение 1 часа для обеспечения возможности многократного ведения разговора и в настоящее время не подходят для нулевого хранения.
- При включенных структурированных выходах предоставленные схемы (либо в формате ответа, либо в определении функции) не подходят для нулевого хранения, хотя сами завершения подходят.
- При использовании сохраненных завершений через опцию store: true в API, эти завершения хранятся в течение 30 дней. Завершения хранятся в нефильтрованной форме после ответа API, поэтому избегайте хранения завершений с чувствительными данными.
** Assistants API:
Объекты, связанные с API Assistants, удаляются с наших серверов через 30 дней после их удаления через API или панель управления. Объекты, не удаленные через API или панель управления, хранятся бесконечно.
Оценочные данные: Когда вы создаете оценку, данные, связанные с этой оценкой, удаляются с наших серверов через 30 дней после удаления через панель управления. Оценочные данные, не удаленные через панель управления, хранятся бесконечно. Для получения подробностей ознакомьтесь с нашими политиками использования данных API. Чтобы узнать больше о нулевом хранении, свяжитесь с нашей торговой командой.
Совместимость конечных точек и моделей
Конечная точка | Последние модели |
---|---|
/v1/assistants | Все модели GPT-4o (кроме chatgpt-4o-latest), GPT-4o-mini, GPT-4 и GPT-3.5 Turbo. Инструмент поиска требует gpt-4-turbo-preview (и последующие версии моделей с датированием выпусков) или gpt-3.5-turbo-1106 (и последующие версии). |
/v1/audio/transcriptions | whisper-1 |
/v1/audio/translations | whisper-1 |
/v1/audio/speech | tts-1, tts-1-hd |
/v1/chat/completions | Все модели GPT-4o (кроме режима Realtime), GPT-4o-mini, GPT-4 и GPT-3.5 Turbo и их версии с датированием выпусков. динамическая модель chatgpt-4o-latest. Настроенные версии gpt-4o, gpt-4o-mini, gpt-4 и gpt-3.5-turbo. |
/v1/completions (Legacy) | gpt-3.5-turbo-instruct, babbage-002, davinci-002 |
/v1/embeddings | text-embedding-3-small, text-embedding-3-large, text-embedding-ada-002 |
/v1/fine_tuning/jobs | gpt-4o, gpt-4o-mini, gpt-4, gpt-3.5-turbo |
/v1/moderations | text-moderation-stable, text-moderation-latest |
/v1/images/generations | dall-e-2, dall-e-3 |
/v1/realtime (beta) | gpt-4o-realtime-preview, gpt-4o-realtime-preview-2024-10-01 |