TGTGInsightаналитика telegramLIVE / telegram public index
Содержимое поста
Содержимое
Обновился лидерборд русскоязычного бенчмарка для оценки бизнес-OCR от MWS. В лидерах – Gemini и Alice AI Полный лидерборд лежит на GitHub. В тройке лидеров, кроме Gemini — новая визуально-языковая модель Яндекса Alice AI VLM dev, часть большой Alice AI VLM, об обучении которой компания совсем недавно рассказала в техрепорте. Оттуда можно заимствовать подход к обучению VLM под OCR-задачи и узнать об архитектурных изменениях в VLM Яндекса.