Chiron Health AI Raises $300K
Chiron Health AI raised $300.72K on November 22, 2024, aimed at helping individuals manage chronic conditions effectively. More details can be found at their website Chiron Health AI.
#HealthTech#AI#Funding#ChronicConditions#VC
🌟Trinity Nano и Trinity Mini: ответ американских разработчиков на китайское доминирование.
В последний год любой, кто следит за развитием моделей с открытыми весами знает - Китай недостижим.
Qwen и DeepSeek фактически задали стандарт того, как должна выглядеть современная архитектура MoE. В США же большинство компаний занимались лишь доработкой чужих чекпоинтов.
И вот, американская компания Arcee AI собралась Make America Great Againвернуть инициативу и создать семейство открытых моделей, обученных "от и до" в США, весами которых бизнес может владеть по-настоящему.
Компания столкнулась с тем, что корпоративным клиентам нужна "юрисдикционная безопасность" . Специалистов по комплаенсу уже не устраивает ответ "мы дообучили модель неизвестного происхождения". Им нужен полный контроль над пайплайном данных.
Семейство моделей Arcee AI получило имя Trinity. Пока в превью-релиз вошли 2 конфигурации:
🟢Trinity Mini — это обычная ризонинг-модель на 26 млрд. общих и 3 млрд активных параметров, обученная с нуля.
🟢Trinity Nano Preview — это модель чата. Она создана, чтобы быть харизматичной и интересной в общении несмотря на свои скромные 6 млрд. общих и 1 млрд. активных параметров.
И пока мы тестируем Nano и Mini, Arcee AI тренирует флагмана Trinity Large.
Его релиз запланирован на январь 2026 года. Это будет модель на 420 млрд. параметров, из которых 13 млрд. будут активны.
Обе доступные модели, Trinity Nano и Trinity Mini выпущены под лицензией Apache 2.0. Они опубликованы на Hugging Face и поддерживаются llama.cpp, LM Studio и vLLM.
Mini также доступна через OpenRouter по очень привлекательной цене - около 4,5 центов за 1 млн. токенов.
📌Лицензирование: Apache 2.0 License.
🟡Статья
🟡Набор моделей
🟡Demo Trinity Mini
@ai_machinelearning_big_data
#AI#ML#MoE#Trinity#ArceeAi
🌟PaddleOCR-VL-1.5: компактная модель для сложного парсинга.
PaddlePaddle обновили свою линейку PaddleOCR-VL, выпустив PaddleOCR-VL-1.5 - компактную VLM на 0.9 млрд. параметров на базе ERNIE-4.5-0.3B-Paddle. Несмотря на скромный размер, в задачах разбора документов она показывает SOTA-результаты.
На тесте OmniDocBench v1.5 модель выбила 94.5% точности, обойдя не только прошлую версию, но и более тяжелых конкурентов.
Фишка обновления - упор на полевые условия. Модель специально учили работать с плохими исходниками: кривыми сканами, бликами от мониторов и мятыми страницами.
Попутно сделали бенчмарк Real5-OmniDocBench, который гоняет модели по 5 сценариям: сканирование, перекосы, деформация листа, фото с экрана и плохое освещение.
🟡В 1.5 добавили:
🟢Text spotting: находит и распознает текст одновременно (печатный русский - неплохо, рукописный - почти никак)
🟢Seal recognition: распознает печати (русские - не очень, китайские - на ура).
🟢Cross-page table merging: умеет склеивать таблицы, которые разорваны между страницами.
🟢Работа с заголовками: не теряет структуру параграфа при переходе на новый лист.
🟢Новые языки: добавили поддержку тибетского и бенгальского, подтянули распознавание редких символов и древних текстов.
🟡Деплой - на любой вкус
Модель работает с transformers, дружит с Flash Attention 2 и, само собой, поддерживается PaddlePaddle 3.2.1.
Если нужно быстро поднять сервис - есть готовый Docker-образ.
🟡Пара важных моментов по использованию
Если нужен полноценный постраничный парсинг всего документа, лучше использовать официальный пакет PaddleOCR. Реализация через transformers пока ограничена только распознаванием отдельных элементов и споттингом.
В пайплайн встроили логику препроцессинга. Если картинка меньше 1500 пикселей, она автоматом апскейлится фильтром Lanczos. При этом есть потолок в 1.6 млн. пикселей для споттинга, это чтобы не перегружать память GPU и сохранить читаемость мелкого шрифта.
📌Лицензирование: Apache 2.0 License.
🟡Модель
🟡Arxiv
🟡Demo
🟡DeepWiki
🖥Github
@ai_machinelearning_big_data
#AI#ML#VL#OCR#PaddleOCR
🔊【#深度解读】
【未来已来】你以为 AI 只会取代重复性工作?DeepMind 联合创始人、微软 AI 掌门人 Mustafa Suleyman 独家揭秘:从“幻觉”真相到 AGI 边界,从 Copilot 革命到工作新生态,6 大主题带你直击 AI 势不可挡的未来!
👇点击下方链接,直达深度访谈全文,让我们一起洞见下一个时代! #人工智能#AI#AGI#科技#未来#工作革命
👉阅读全文