Нейросеть чатгпт картинки

Мультимодальные модели представляют собой алгоритмы, способные работать не только с текстом, но и картинками, видео и аудио. В статье про языковую модель GPT-4 мы писали, что согласно прогнозам, уже она должна стать мультимодальной. И вот прогнозы, похоже, сбываются — обновление, которое OpenAI обещает «раскатать» на всех в течение двух недель, наделит нейросеть способностью синтеза и распознавания речи, а также анализа изображений. В мобильном приложении нейросети уже доступен голосовой ввод, но этим никого не удивишь. Синтез речи, который скоро тоже будет доступен всем, включить не так просто. Для этого зайдите в…
Читать далее