Введение
API OpenAI обладает широкими возможностями для применения в разнообразных задачах. Мы предлагаем несколько моделей с разными характеристиками и ценовыми категориями, чтобы каждый мог выбрать наиболее подходящий вариант.
Другие ресурсы
Основные концепции
Модели генерации текста
Модели, такие как GPT-4 и GPT-3.5, относятся к типу генеративных предварительно обученных трансформеров (GPT), которые разработаны для понимания как естественного, так и формального языка. Эти модели способны создавать текст, отвечая на предоставленные данные — так называемые "prompts". В процессе создания prompt важно указать инструкции или примеры, чтобы модель смогла эффективно выполнить заданную задачу. Модели GPT-4 могут быть использованы в множестве сценариев: от генерации контента и программного кода до суммирования, ведения диалогов, творческого письма и многих других применений. Дополнительную информацию можно найти в нашем вводном руководстве по генерации текста и руководстве по prompt-engineering.
Embeddings
Embeddings - это векторное представление данных, например, текста, которое сохраняет важные аспекты его содержания и смысла. Данные, которые схожи по каким-то признакам, будут иметь более близкие эмбеддинги, чем те, что не связаны. OpenAI предлагает модели, которые создают текстовые эмбеддинги: они принимают строку текста и возвращают вектор, который можно использовать в таких задачах, как поиск, кластеризация, рекомендации, обнаружение аномалий и классификация. Для подробностей см. наше руководство по эмбеддингам.
Токены
Модели для генерации текста и эмбеддингов обрабатывают текст, разбивая его на более мелкие элементы, называемые токенами. Токены — это обычно встречающиеся последовательности символов. Например, слово "tokenization" может быть разделено на два токена: "token" и "ization", в то время как слово "the" будет представлено одним токеном. Токены начинаются с пробела после каждого слова.
Важно учитывать, что общий размер текста, включая prompt и сгенерированный ответ, не должен превышать максимальную длину контекста модели для генерации текста. Для эмбеддингов ввод также должен быть в пределах максимальной длины контекста модели. Информацию о максимальных длинах контекстов для всех моделей можно найти в индексе моделей.
Руководства
Освойте основы, создав простое демонстрационное приложение.
Узнайте, как создавать и обрабатывать текст с помощью наших моделей.
Изучите, как искать, классифицировать и сравнивать текстовые данные.
Узнайте, как преобразовывать аудиофайлы в текст с помощью нашей технологии распознавания речи.
Откройте для себя, как генерировать и редактировать изображения с помощью моделей OpenAI.
Узнайте, как использовать GPT-4 для обработки и анализа визуальной информации.