TGTGInsighttelegram intelligenceLIVE / telegram public index
← The Digi Doodles
The Digi Doodles avatar

TGINSIGHT POST

Post #97

@Digi_doodles

The Digi Doodles

Views3Post view count
PostedAug 2308/23/2024, 04:31 AM
Post content

Post content

#AI Инженеры китайской компании Alibaba представили мультимодальную модель машинного обучения. С её помощью можно анализировать текст, изображения и видео. Разработчики делают упор именно на скорость работы нейросети, отмечая, что на обработку двухчасового видео уйдёт всего четыре секунды. В основе mPLUG-Owl3 используется модель Qwen2, которую доработали и оптимизировали. Благодаря этому в шесть раз сократилось время ожидания первого токена, а на одной видеокарте A100 можно обрабатывать по 400 изображений в секунду.