На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Газета.ру

8 728 подписчиков

Свежие комментарии

  • Алекс Архипов
    Теперь дронов у ВСУ прибавиться за счет "Дружбы". Наш олигархат кормит ВСУ.В Словакии сообщи...
  • Алекс Архипов
    Мстя будет страшна.Депутат Колесник:...
  • Александр Салтановский
    Да не хлеб он должен печь в колонии, а тайгу валить ручной "Дружбой-2", с таким же напарником как и он сам!!!Mash: экс-губерна...

OpenAI представила "рассуждающий" генератор изображений Images 2.0

OpenAI представила новую модель генерации изображений Images 2.0, интегрированную в ChatGPT и доступную через API. Решение стало первой визуальной моделью компании с поддержкой "рассуждений", что расширяет сценарии ее применения.

По заявлениям разработчика, при использовании рассуждающих режимов модель способна анализировать контекст запроса, выполнять поиск релевантной информации и генерировать несколько вариантов изображений с последующей проверкой результатов.

Это позволяет повысить точность и вариативность генерации.

Отдельное внимание уделено улучшенной работе с нелатинским алфавитом: модель корректно воспроизводит текст на разных языках, включая японский, корейский, китайский, хинди и бенгали.

Images 2.0 также демонстрирует более высокий уровень детализации и реалистичности, в частности, за счет добавления мелких визуальных "несовершенств" и точной передачи различных художественных стилей, включая кинематографические сцены и пиксельную графику.

В компании отмечают, что модель пока может испытывать трудности с отдельными задачами, такими как генерация пошаговых инструкций, например, оригами, головоломок или сложных геометрических деталей.

Обновленная модель уже доступна пользователям ChatGPT и Codex, однако функции рассуждения открыты лишь подписчикам платных тарифов. Модель gpt-image-2 также интегрирована в API для разработчиков.

 

Ссылка на первоисточник
наверх