TGTGInsighttelegram intelligenceLIVE / telegram public index
← КриптоАтака 👀

TGINSIGHT SIMILAR POSTS

Најди сличен содржај

Изворен канал @cryptoattack · Post #20708 · 23 дек.

😨Главное за сегодня: 🇺🇸США (крипто-#ETF): - Трамп назначил Бо Хайнса главой "Криптосовета", а CEO a16z назначен старшим советником по вопросам #AI - Налоговая США (IRS) утверждает, что стейкинг криптовалют облагается налогом - Phoenix Group планирует листинг на Nasdaq в 2025 году 🇰🇵#HYPE В HyperLiquid наблюдается рекордный отток на фоне опасений пользователей, что северокорейские хакеры могут искать уязвимости (несколько кошельков северокорейских хакеров имеют потери >700 000$ от торговли на бирже). #HYPE Hyperliquid Labs опровергают, что их взломали 🇰🇷 Новый комитет Южной Кореи разрабатывает санкции против манипуляторов крипторынка 🇸🇻#BTC Правительство Сальвадора продолжает накопление#BTC 🇯🇵 Gate Group приобрели Coin Master и официально вышли на японский рынок 🔥 MicroStrategy приобрели ещё 5,262 #BTC 🥳#BNB Binance Alpha выпустили новую партию проектов 🥳#TONПавел Дуров: Общая выручка Telegram в 2024 году превысила 1 млрд $, и мы завершаем год с более чем 500 млн $ денежных резервов, не считая криптоактивов 🙋‍♂ Nokia подали патент на «устройство, метод и компьютерную программу», которые могут шифровать цифровые активы 🥳#CRO Crypto .com запускает регулируемую службу хранения цифровых активов для клиентов из США и Канады 🙋‍♂ Moonpay ведет переговоры о приобретении Helio за ~150 млн $ 🚫 Регулятор Малайзии запретили Atomic Wallet работать в стране 🔮#CGX#RON Community Gaming запустит свой рынок прогнозов Forkast, ориентированный на игры, в сети #RONIN ✅ Paraswap DAO одобрила внедрение нового токена для замены #PSP 🙋‍♂#LDO#ETH Lido запустили Ethereum SDK 🆕Листинги: - Binance добавляет фьючерсы на #HIVE - Binance Launchpool добавляет#BIO 🕵️‍♂️Активность китов и SmartMoney: - С адреса команды Pendle перевели 625 000 #PENDLE на Binance - транзакции китов 📊Графики и отчёты: - #FUD Новые трейдеры, которые присоединились к рынку за последние 2-3 месяца, активно распродают#BTC и #ETH - WhaleMap: Уровень 98 133$ остаётся важным, учитывая китовые накопления #BTC - за последние 2 года наблюдался значительный рост числа держателей криптовалют 📈 - #UNI Общий объем #USDC на Uniswap превысил 1 трлн $ 📈 - DropsTab: новые токены в стадии накопления, поддерживаемые топовыми венчурными инвесторами - ТОП#AI-агентов по росту цен за последние 7 дней - отчёт CoinShares по фин потокам - отчет BNB Chain за 2024 год #BNB 💰Сборы средств: - Avalon Labs - 10 млн $ - #USUALUsual - 10 млн $ от Binance и Kraken ✏️События на завтра: 🔓 Разлоки: Ribbon Finance (#RBN) - 1,06% ($4,18m) 🎁#AGI Delysium запустят программу вознаграждений 🇺🇸 Durable Goods Orders (MoM) (Nov) - 16:30 мск - Redbook (YoY) - 16:55 мск - New Home Sales (Nov) - 18:00 мск

Резултати

Пронајдени 1 слични објави

Пребарај: #pointsreader

当前筛选 #pointsreader清除筛选
Machinelearning

@ai_machinelearning_big_data · Post #8447 · 04.09.2025 г., 08:07

🌟POINTS-Reader: компактная VLM для OCR без дистилляции и сложной обвязки. Tencent опубликовали довольно интересный проект - POINTS-Reader. Это VLM для OCR английского и китайского языков на 4 млрд. параметров на базе Qwen2.5-3B-Instruct, которая обошла GPT-4o и Gemini на бенче OmniDocBench. POINTS-Reader - это философия предельной простоты c прямолинейным конвейером: на вход подается изображение документа и фиксированный промпт, а на выходе получается извлеченный текст. Никаких этапов постобработки, скриптов для очистки или дополнительных моделей — результат сразу готов к использованию. Помимо скромной базовой Qwen2.5, в POINTS-Reader использовали умеренный по нынешним меркам Vision Transformer - NaViT на 600 млн. параметров. И это осознанный инженерный шаг в угоду простоте и производительности. Современные фреймворки для инференса, будь то SGLang или vLLM, в первую очередь оптимизированы под LLM-часть, из-за чего громоздкий ViT становится узким местом и серьезно замедляет всю систему. Такая компактная архитектура превосходно показала себя на тестах. На комплексном OmniDocBench модель набрала 0.133 для английских документов и 0.212 для китайских. Эти цифры ставят POINTS-Reader в один ряд с гораздо более тяжелыми и сложными системами. Секрет проекта кроется в двухэтапной стратегии подготовки данных, которая полностью отказывается от дистилляции знаний у моделей-учителей. На первом этапе модель получает базовые навыки OCR, обучаясь на синтетике. Дальше начинается самый интересный этап — непрерывная самоэволюция. Модель используется для генерации аннотаций на реальных документах, после чего лучшие из полученных образцов используются для ее дообучения. Этот итеративный процесс позволяет постоянно повышать качество как самой модели, так и генерируемых ею данных. Этот метод к самосовершенствованию описан в техотчете как очень гибкий и применимый, по словам Tencent, практически к любой другой архитектуре. 🟡Как в любом проекте - есть нюансы. Модель пока не очень уверенно справляется со сложными макетами, вроде газетной верстки, что может приводить к повторению или пропуску контента. Аналогичные трудности возникают и при обработке рукописного текста, например, в чеках или заметках. Кроме того, на данный момент POINTS-Reader поддерживает только английский и китайский языки. ▶️ Запустить эту прелесть модель можно на Transformers или в SGLang. Поддержку vLLM обещают добавить. 🟡Модель 🟡Arxiv 🖥GitHub @ai_machinelearning_big_data #AI#ML#VLM#POINTSReader#Tencent