Компания OpenAI выпустила две новые языковые модели — gpt-oss-120b и gpt-oss-20b. Эти модели с открытым исходным кодом доступны для бесплатного использования и доработки, что дает разработчикам возможность интегрировать их под различные задачи.
Как OpenAI сделала модели доступными для всех?
Это первый случай после выхода GPT-2, когда OpenAI публикует новые модели с открытым исходным кодом. Сторонние разработчики могут использовать модели gpt-oss-120b и gpt-oss-20b и адаптировать их под свои нужды. Компания также планирует собирать отзывы и проводить презентации для разработчиков по всему миру. Модели распространяются под лицензией Apache 2.0, что позволяет их модификацию и коммерческое использование.
Ключевые характеристики моделей gpt-oss-120b и gpt-oss-20b
gpt-oss-120b — это модель с 120 миллиардами параметров, предназначенная для использования в дата-центрах и на мощных рабочих станциях. gpt-oss-20b — это облегченная версия, подходящая для большинства современных ноутбуков и ПК. Модели показали отличные результаты на тестах: gpt-oss-120b набрала 90 баллов на MMLU, а gpt-oss-20b — 85,3. Обе модели поддерживают работу с длинными цепочками рассуждений, веб-поиском и выполнением Python-кода.
Почему OpenAI вернулась к open-source?
Возвращение OpenAI к открытым моделям обусловлено растущей конкуренцией со стороны других производителей ИИ, а также запросами на прозрачные и безопасные технологии. Компания уверяет, что все модели прошли тщательное тестирование на безопасность и могут использоваться в чувствительных проектах.
Как использовать модели gpt-oss?
Модели уже доступны на платформе Hugging Face и поддерживаются движками vLLM, Ollama и Transformers. OpenAI также выпустит обучающие материалы и продолжит собирать обратную связь от пользователей для совершенствования своих продуктов.