部分研究团队加入谷歌后,AI IDE 企业 Windsurf 被 Cognition 收购
AI IDE 企业 Windsurf 14 日宣布已被 Cognition 收购。此前,Windsurf 于 11 日与谷歌达成交易,联合创始人 Douglas Chen、时任首席执行官 Varun Mohan 及部分研究团队加入谷歌。Windsurf 临时首席执行官 Jeff Wang 称,此次合并将结合双方在自主智能体和智能体 IDE 方面的技术,带来突破性的开发人员体验。Windsurf 的用户和客户将继续享受稳定服务和产品创新,其知识产权也将并入 Cognition。IT之家
🏷#Windsurf#Cognition#AI#收购
📢频道👥群组📝投稿
🚀 Алматы стал точкой на технологической карте мира
В «Атакенте» завершился первый GITEX AI Central Asia & Caucasus — крупнейшее IT-событие в истории региона.
Цифры: 600+ компаний из 60 стран, 10 000 участников, 100 инвесторов с активами $200+ млрд. Открывал лично Президент Токаев.
🎙 На повестке — суперкомпьютер Al-Farabium, дата-центры (×5 к 2030), беспилотное такси, цифровая таможня KEDEN. Участвовали Cisco, Dell, Huawei, Google Cloud.
💰 Одобрены сделки с фондами Bigsky, MOST и Sturgeon — новые каналы капитала для местных стартапов.
🧒 Премьера — Almaty Children's Science Museum, первый детский научный музей в Центральной Азии.
Главная мысль Токаева: Казахстан больше не догоняет — Казахстан размечает поле. 🇰🇿
#GITEX#AI#Казахстан#Алматы#стартапы
UN Forms High-level Advisory Body on AI for Global Governance
Hello, everybody! The United Nations Secretary-General has launched a multi-stakeholder High-level Advisory Body on Artificial Intelligence. This groundbreaking initiative is set to tap into AI's vast potential for humanity while simultaneously addressing the associated global risks and uncertainties posed by the rapid proliferation of AI technologies.
The Advisory Body will encompass up to 38 experts spanning various disciplines, including government, the private sector, and civil society. These experts, hailing from across the globe, bring diverse viewpoints on AI governance to the table. Their aim is to foster collaboration with existing and emerging initiatives alongside international organizations, creating a balanced and comprehensive dialogue on AI governance.
The UN's initiative to convene a High-level Advisory Body on AI is a proactive step towards establishing a coherent global framework for AI governance.
#UNAIAdvisoryBody#AI#GlobalGovernance
President Biden Issues Executive Order on AI
President Biden has issued an Executive Order to ensure the United States takes the lead in harnessing the potential and addressing the risks of artificial intelligence.
This executive order sets new standards for AI safety and security, protects privacy, advances equity and civil rights, promotes innovation and competition, and asserts American leadership globally.
#AI#Biden#ExecutiveOrder
Claude Code创造者揭示了他的工作流程
Anthropic的 Claude Code 创造者鲍里斯·切尔尼分享了一种高效的工作流程,通过并行运行多个Claude AI代理,并结合验证循环和共享内存,使单个开发者能够达到与小型工程团队相当的产出。该方法已被行业专家视为软件开发领域的潜在“分水岭”,并可能标志着Anthropic的“ChatGPT时刻”。切尔尼的工作流程强调了“用更少做更多”的理念,将开发过程从传统的代码编写转变为对自主AI单元的指挥。Slashdot
🏷#ClaudeCode#AI#开发者#工作流
📢频道👥群组📝投稿
📖New Research from Anthropic Shows that AI Hides Its Thoughts
A recent study by Anthropic’s Alignment Science Team reveals that even advanced AI models like Claude 3.7 Sonnet routinely obscure the actual reasoning behind their answers. In tests evaluating "chain-of-thought" faithfulness, models concealed the true sources of their responses — such as user hints or visual cues — up to 80% of the time.
Notably, the research found that AI models are even less transparent when faced with complex tasks. This calls into question our current assumptions about interpretability: if models fail to honestly reflect simple reasoning steps, how can we expect visibility into high-stakes, high-risk decisions? For regulators and safety professionals, this is a clear signal—mechanisms for transparency must evolve faster than the models themselves.
#AI#AIExplainability#AITransparency#AIEthics
🌟Tencent сжали 1.8B модель в 2 бита: 600 МБ веса и Dual-CoT на борту.
Tencent Hunyuan выкатили open-source решение для тех, кто хочет запускать LLM локально на кофеварке.
HY-1.8B-2Bit - модель, которую утрамбовали так плотно, что она занимает меньше места, чем многие современные мобильные приложения.
Модель пилили методом Quantization-Aware Training, который в отличие от PTQ, позволяет адаптироваться к низкой разрядности весов еще на этапе тренировки.
За основу взяли backbone Hunyuan-1.8B-Instruct и жестко сжали веса до 2 бит. При этом эффективный размер в памяти получился эквивалентен модели на 300М параметров, а физический вес получился всего 600 МБ.
Что самое ценное - сохранили фичу Dual-CoT: модель умеет переключаться между быстрым мышлением для простых тасков и глубоким long-CoT для сложных.
🟡Бенчмарки
🟢По сравнению с fp16-учителем (1.8B), деградация метрик всего ~4%. Это очень мало для 2-битного квантования.
🟢Разница в точности на сравнении с INT4 ничтожна - 0.13%, хотя весит модель в 2 раза меньше.
🟢Если взять плотную модель на 0.5B параметров, то HY-1.8B-2Bit обходит ее в среднем на 16-17%. На GSM8K разрыв вообще дикий: +22.29%.
🟢Prefill ускорился в 3-8 раз, генерация токенов - в 2-3 раза на поддерживаемом железе.
🟡Жирный нюанс
Текущая реализация требует поддержки инструкций Arm SME2. Это значит, что вся эта красота заведется только на Apple M4 и MediaTek Dimensity 9500.
Если у вас M1/M2 или Snapdragon прошлых поколений - пока мимо. Разработчики обещают подвезти Neon kernel позже.
Кстати, GGUF тоже есть, так что если под рукой есть M4 - можно тестить. Остальным остается ждать оптимизации под старые инструкции.
🟡Модель
🟡GGUF
🟡Техотчет
🖥GitHub
@ai_machinelearning_big_data
#AI#ML#SLM#2bitQ#Tencent
🚀 DeepSeek-V3.2-Exp - вышла новая экспериментальная версия
⚡ Главное:
- Основана на V3.1-Terminus
- Новый механизм Sparse Attention (DSA) → быстрее и дешевле работа с длинными контекстами
- Качество почти без потерь, производительность как у V3.1
- API подешевел более чем на 50%
📊 V3.1 пока ещё будет доступна до 15 октября 2025.
💰 Цены:
- Input (cache hit): $0.07 → $0.028 (−60%)
- Input (cache miss): $0.56 → $0.28 (−50%)
- Output: $1.68 → $0.42 (−75%)
🔗 Hugging Face: https://huggingface.co/deepseek-ai/DeepSeek-V3.2-Exp)
🔗 Tech Report:https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf)
🔗Github: https://github.com/deepseek-ai/DeepSeek-V3.2-Exp/blob/main/DeepSeek_V3_2.pdf
@ai_machinelearning_big_data
#DeepSeek#AI#V32#SparseAttention#LLM