Содержимое
Нативная генерация изображений в gpt-4o Умельцы обнаружили упоминание модели gpt-4o для генерации изображений в ChatGPT. Хоть 4o и является омнимодальной, но нативная генерация изображений в ней была недоступна для пользователей (причины могли быть разные). Прошел почти год с презентации gpt-4o и вот только сейчас появились первые намёки, что наконец-то дождёмся полной омнимодальности. Не так давно Сэм заявил, что вот-вот удивит нас улучшенной генерацией изображений (я писал вот тут об этом). Вот что заявлялось о нативной генерации изображений в мае 2024: Омнимодальность GPT-4o обеспечивает более быструю и качественную генерацию изображений по сравнению с DALL·E 3. Она точнее интерпретирует текстовые подсказки, создавая визуально реалистичные сцены, и значительно лучше справляется с встраиванием текста в изображения, сохраняя их естественность и читаемость. Сейчас для генерации изображений используется DALL-E и в развитии эта модель кажется заглохла. ИИволюция