TGTGInsighttelegram intelligenceLIVE / telegram public index
← Midjourney/Nano Banana Prompts NeuroSpark

TGINSIGHT SIMILAR POSTS

Trouver du contenu similaire

Chaîne source @Shutter · Post #4607 · 22 mai

Harbor, cargo port, ships #AI#artificial_Intelligence

Résultats

10,064 posts similaires trouvés

Recherche globale générale

Machinelearning

@ai_machinelearning_big_data · Post #9898 · 15/04/2026 14:10

🌟Audio Flamingo Next: открытая аудио-языковую модель от NVIDIA Audio Flamingo Next (AF-Next) - аудио-языковая модель, обученная на корпусе из 1 млн часов аудио и 108 млн примеров для генерации подробных текстовых описаний аудиозаписей: перечисление инструментов, звуковых событий и музыкальных характеристик того, что звучит на записи. Максимальная длина входного аудио - 30 минут. Релиз закрывает отставание мультимодальных систем в работе со звуком: речью, музыкой и окружающими шумами на длинных записях. 🟡Архитектура собрана из 4-х блоков: 🟢Кодировщик AF-Whisper (128-канальная лог-мел-спектрограмма, окно 25 мс, шаг 10 мс, выход 50 Гц); 🟢Двухслойный MLP-адаптер; 🟢Qwen-2.5-7B с расширенным контекстом 128K токенов; 🟢Потоковый TTS-модуль для голосовых диалогов. Фишка архитектуры - Rotary Time Embeddings: угол поворота токена привязывается к реальной временной метке аудио, что дает модели устойчивое временное рассуждение. 🟡Релиз состоит из 3-х версий AF-Next-Captioner: модель, заточенная под детальное описание аудио. Она генерирует подробные текстовые описания аудиозаписей: перечисляет инструменты, звуковые события, спикеров и музыкальные характеристики того, что звучит на записи, с привязкой к таймкодам. На распознавании инструментов Medley-Solos-DB она набирает 92,13 против 85,80 у Audio Flamingo 2. На музыкальных описаниях SongCaps, где качество оценивает GPT-5, показатели покрытия и корректности выросли с 6,7 и 6,2 у AF3 до 8,8 и 8,9. AF-Next-Instruct: универсальная инструктивная версия, после GRPO для повседневных задач: ответов на вопросы по аудио, голосовых ассистентов, транскрипции речи и перевода. Именно она устанавливает новые планки среди LALM по ASR. WER 1,54 на LibriSpeech. На LongAudioBench 73,9 против 60,4 у закрытой Gemini 2.5 Pro (в варианте с речью разрыв еще больше - 81,2 против 66,2.) AF-Next-Think: ризонинг-версия с Temporal Audio Chain-of-Thought: модель привязывает каждый шаг рассуждения к конкретной временной метке в аудио, что делает ее пригодной для разбора длинных записей, где нужно собирать факты из разных моментов (анализа совещаний, интервью, подкастов, трейлеров и сюжетных аудиоисторий). 75,01 на MMAU-v05.15.25 и 58,7 на более жестком MMAU-Pro, что выше, чем у Gemini-2.5-Pro (57,4). 📌Лицензирование: NVIDIA OneWay Noncommercial License. 🟡Страница проекта 🟡Arxiv 🟡Demo 🖥GitHub @ai_machinelearning_big_data #AI#ML#MMLM#Audio#AudioFlamingo#NVIDIA

Machinelearning

@ai_machinelearning_big_data · Post #8645 · 29/09/2025 14:05

🔬 Учёные MIT представили SCIGEN - новый инструмент, который учит генеративные модели создавать реально полезные материалы, а не только «красивые картинки». Обычно ИИ придумывает структуры, похожие на уже известные, и редко выходит за рамки. SCIGEN решает эту проблему: он накладывает строгие геометрические ограничения прямо на процесс генерации, заставляя модель искать нестандартные, но стабильные решения. В экспериментах команда сгенерировала миллионы кандидатов и отфильтровала их по устойчивости и свойствам. Итог - два ранее неизвестных соединения (**TiPdBi** и **TiPbSb**) удалось реально синтезировать в лаборатории, и они подтвердили предсказанные характеристики. Это шаг к будущему, где материалы для электроники, квантовых технологий и энергетики будут не «искать годами», а проектировать целенаправленно с помощью ИИ. https://news.mit.edu/2025/new-tool-makes-generative-ai-models-likely-create-breakthrough-materials-0922 @ai_machinelearning_big_data #AI#MIT#GenerativeAI#MaterialsScience#SCIGEN

Machinelearning

@ai_machinelearning_big_data · Post #8474 · 08/09/2025 20:52

🚀 Grok 2.5 теперь можно запускать локально! Unsloth выкатили оптимизированную версию модели: 🔹270B параметров работает на обычном Mac с 128GB RAM (~5 токенов/сек) 🔹 Размер уменьшен с 539GB до 118GB (–80%) 🔹 Ключевые слои модели сохранены в 8-битном формате, а все остальные сжаты с помощью динамического 3-битного GGUF. 🟢Гайд: https://docs.unsloth.ai/basics/grok-2 🟢 GGUF: https://huggingface.co/unsloth/grok-2-GGUF @ai_machinelearning_big_data #AI#xAI#Grok2#LLM#OpenSource#MachineLearning#DeepLearning

AI & Law

@ai_and_law · Post #171 · 22/11/2023 08:04

Big Tech's Dominance in AI Sparks Calls for Integrated Regulations Hello, everyone! A new report by the Open Markets Institute and the Center for Journalism and Liberty at Open Markets reveals a concentrated control over the future of AI by a handful of Big Tech companies. The report suggests that a more integrated approach to AI regulations is vital to ensure that AI serves the broader public interest rather than primarily benefiting the largest corporations. The findings underscore the ongoing discussions around the need for comprehensive and equitable AI policies. #AI#BigTech#Regulation#OpenMarkets

耕读频道

@iGengdu · Post #601 · 06/11/2024 14:05

#AI#Prompt#AI提示词#写好提示词#中文AI提示词指南#智汇AI 分享我花了两天时间写的一篇博文:如何写好AI提示词?AI提示词中文指南 本文将从AI提示词的界定、写好AI提示词的重要性分析、写好AI提示词的基本思路,以及写好AI提示词的常用技巧;这是个部分,分别对应文章的四个部分。 内容还包括:各大AI公司(OpenAI、Anthropic、Google、MicroSoft等)给出的AI提示词指南和中文AI提示词指南。 📢频道✈️群组 (耕读)📬投稿

IELTS|Newspapers & Magazines|English

@emagzinewspars · Post #9422 · 27/10/2025 03:34

#MIT_Technology_Review🇺🇸📕[PDF]⬇️ #November2025 #December2025 #Monthly_Magazines For learning, for free(dom). @backupofmagazines In this issue, the cover story explores the rise of “designer babies” and the booming #GeneticTesting industry promising parents control over traits from #IQ to eye color. As #AI meets biology, scientists warn of deep ethical divides in #EmbryoSelection and #BioTech regulation. Other features decode aging “clocks,” AI in healthcare pain detection, and new insights into human resilience to #ClimateChange. From #ArtTech to #StemCells, this edition examines how innovation blurs the line between evolution and engineering — and asks, are we ready to build perfection itself?

AI一线|ShareCentre

@ShareCentre · Post #7163 · 08/04/2026 08:59

🚀 智谱发布 GLM-5.1:全球最强开源模型,SWE-Bench Pro 登顶,可持续工作 8 小时 智谱(Z.AI)于 4 月 7 日正式发布新一代旗舰模型 GLM-5.1,定位面向长程任务(Long-Horizon Tasks)的智能体工程模型。GLM-5.1 以 MIT 许可开源,官方称其为「目前全球最强的开源模型」。 ⚙️ 核心能力 - SWE-Bench Pro 58.4%,全球第一,超越 GPT-5.4(57.7)和 Claude Opus 4.6(57.3),国产模型首次在该基准上登顶 - Terminal-Bench 2.0(Claude Code)63.5,NL2Repo 42.7,均大幅领先上代 GLM-5 - CyberGym 68.7,超越 Opus 4.6(66.6),网络安全能力显著 - HLE 31.0(with tools 52.3),GPQA-Diamond 86.2,推理能力全面提升 📌 长程任务:核心突破 GLM-5.1 的关键差异化在于「长程持续优化」能力——给它更多时间,结果就更好: - 向量数据库优化:600+ 轮迭代、6000+ 次工具调用后达到 21.5k QPS,是此前 Opus 4.6 最佳成绩(3,547 QPS)的 6 倍 - GPU 内核优化(KernelBench Level 3):50 个问题上实现 3.6× 加速,持续 1200 轮仍有提升空间(Opus 4.6 达 4.2×,仍领先) - Linux 桌面构建:在无任何启动代码的情况下持续工作 8 小时,从零构建出包含文件浏览器、终端、文本编辑器、系统监视器、计算器、游戏在内的完整 Web 端桌面环境 此前模型(包括 GLM-5)往往在尝试几种熟悉策略后便陷入停滞,而 GLM-5.1 能自主分解问题、运行实验、分析结果、识别瓶颈并修订策略,在数百轮迭代中持续优化。 🔙 背景 - 智谱近期迭代密集:GLM-4.7(2025-12)→ GLM-5(2026-02,744B MoE)→ GLM-5-Turbo → GLM-5V-Turbo(2026-04-01,视觉编程基座,https://t.me/ShareCentre/7149)→ GLM-5.1 - 伴随此次发布,智谱在 OpenRouter 上再度提价 10%,缓存命中 token 价格已接近 Claude Sonnet 4.6 水平,国产模型首次在核心场景实现与海外头部厂商价格对齐 - 智谱正冲刺「大模型第一股」IPO,商业化节奏持续加快 - GLM-5.1 已面向 GLM Coding Plan 全部用户(Lite/Pro/Max)开放,支持在 Claude Code 和 OpenClaw 中使用 - 高峰时段(北京时间每日 14:00-18:00)消耗 3× 配额,非高峰 2×;4 月底前非高峰按 1× 计费 ⚔️ 竞品对比 - 编码三指标(SWE-Bench Pro + Terminal-Bench 2.0 + NL2Repo)均值全球第三、国产第一、开源第一 - 长程优化能力(VectorDBBench 21.5k QPS)远超所有竞品;KernelBench 上 Opus 4.6(4.2×)仍领先 - Qwen3.6-Plus(4/1 发布)在 Terminal-Bench 和 Agent 基准上构成直接竞争;MiniMax M2.7 SWE-Pro 56.2 紧随其后 - 模型权重在 HuggingFace 和 ModelScope 公开,支持 vLLM 和 SGLang 推理框架 原始博客:https://z.ai/blog/glm-5.1 #AI#智谱#GLM#开源模型#AIAgent#编程#长程任务

#广义#DNS#启动器#AI#Wikipedia#Google#搜索引擎#社区 DNS作为一种映射关系推广成启动器的概念多少还是有些意想不到呢,Wikipedia的这种特性我之前偶尔也发现了 也越发觉得Google不是万能的,无法准确的描述和找到真正想要的,有时候还不如高质量的社区,不过现在AI也能部分替代了,逐步转向为多搜索引擎和AI搜索问答结合

Machinelearning

@ai_machinelearning_big_data · Post #8518 · 11/09/2025 17:11

🔥WFGY 2.0 — Semantic Reasoning Engine for LLMs (MIT) Это движок с открытым исходным кодом, цель которого — уменьшить галлюцинации и логические сбои в системах типа RAG / LLM, особенно когда: - источники OCR-текста плохо распознаются, - происходит «semantic drift» (когда ответ уходит от вопроса), - «ghost matches», когда извлечённый фрагмент кажется релевантным, но на самом деле нет. Обычно ошибки ловят уже в готовом сгенерированном тексте, из-за чего они часто повторяются. В Semantic Reasoning Engine всё наоборот: если система видит, что рассуждения «кривые» или сбились с курса, она останавливается, сбрасывается или ищет другой путь и отвечает только когда состояние стабильно. 🛡Авторы называют это semantic firewall - семантический «файрвол». Проверки встроены прямо в процесс мышления модели, а не поверх ответа с фильтрами или регексами. Это помогает избегать ошибок до того, как они попадут в вывод. 📌 Проект включает карту из 16 типичных ошибок LLM: - неверный поиск данных, - сбившаяся логика, - «провалы памяти», - путаница ролей агентов и другие. Для каждой есть простое текстовое исправление. Никаких SDK — достаточно вставить инструкции прямо в промпт. 🟢Как модель решает, правильные ли ответ генерируется: - ΔS (drift) - не уходит ли смысл слишком далеко от шага к шагу - λ (convergence) - сходится ли рассуждение к решению или крутится в цикле - Coverage — достаточно ли фактов и аргументов учтено Если все три условия выполнены, ответ считается «качественным». 🟢В тестах стабильность вывода выросла до 90–95% против обычных 70–85% у традиционных подходов. ▪Github: https://github.com/onestardao/WFGY @ai_machinelearning_big_data #ai#llm#opensource#reasoning#hallucinations#promptengineering

12•••50•••100•••150•••200•••250•••300•••350•••400•••450•••500•••550•••600•••650•••700•••730731732733734•••750•••800•••838839