На информационном ресурсе применяются рекомендательные технологии (информационные технологии предоставления информации на основе сбора, систематизации и анализа сведений, относящихся к предпочтениям пользователей сети "Интернет", находящихся на территории Российской Федерации)

Газета.ру

8 728 подписчиков

Свежие комментарии

  • Razziel
    Хохлы=иже черкасы, а ещё в прошлом хозары,(Обратите внимание на то что, они!  Не Православные! Жидовня! Убившая Бога!...Постпред Мельник:...
  • Николай Герасименко
    Иногда лучше молчать, чем нести ахинею. Глядишь так и за умную примут....Экс-премьер Финля...
  • Владимир Петров
    Она не обязана говорить против - обязана не говорить за.Депутат Рижской д...

OpenAI представила "рассуждающий" генератор изображений Images 2.0

OpenAI представила новую модель генерации изображений Images 2.0, интегрированную в ChatGPT и доступную через API. Решение стало первой визуальной моделью компании с поддержкой "рассуждений", что расширяет сценарии ее применения.

По заявлениям разработчика, при использовании рассуждающих режимов модель способна анализировать контекст запроса, выполнять поиск релевантной информации и генерировать несколько вариантов изображений с последующей проверкой результатов.

Это позволяет повысить точность и вариативность генерации.

Отдельное внимание уделено улучшенной работе с нелатинским алфавитом: модель корректно воспроизводит текст на разных языках, включая японский, корейский, китайский, хинди и бенгали.

Images 2.0 также демонстрирует более высокий уровень детализации и реалистичности, в частности, за счет добавления мелких визуальных "несовершенств" и точной передачи различных художественных стилей, включая кинематографические сцены и пиксельную графику.

В компании отмечают, что модель пока может испытывать трудности с отдельными задачами, такими как генерация пошаговых инструкций, например, оригами, головоломок или сложных геометрических деталей.

Обновленная модель уже доступна пользователям ChatGPT и Codex, однако функции рассуждения открыты лишь подписчикам платных тарифов. Модель gpt-image-2 также интегрирована в API для разработчиков.

 

Ссылка на первоисточник
наверх