TGTGInsighttelegram intelligenceLIVE / telegram public index
← GitHub Trends

TGINSIGHT SIMILAR POSTS

Find similar content

Source channel @githubtrending · Post #14737 · May 22

#other This book provides a systematic introduction to large language models (LLMs), covering topics like traditional language models, LLM architectures, prompt engineering, efficient parameter tuning, model editing, and retrieval-enhanced generation. It aims to be easy to read and rigorous, with monthly updates and a list of relevant papers. The book helps readers understand LLMs' principles and applications, making it beneficial for those interested in AI and NLP. It offers a structured learning path, which is useful for both beginners and advanced learners. https://github.com/ZJU-LLMs/Foundations-of-LLMs

Hashtags

Results

2 similar posts found

Search: #glm5

当前筛选 #glm5清除筛选
探索号

@seeker_rc · Post #20498 · 05/14/2026, 03:55 AM

💡 产品安利社 在朋友的帮助下搞定了ChatGPT的购买,平时的使用,以及使用魔法 智谱GLM5.1+claude code的选择的确还不错,但是大家都说用codex,所以我也试了试,用自己的账号儿,不用中转站,还是放心很多 昨天简单试了试,体验还行~ via 产品安利社 标签: #ChatGPT#智谱#GLM5 ⚡️探索号频道 ⚡️探索者频道 ⚡️探索者交流群 ⚡️ Youtube 频道:科技探索者 每天推荐有趣内容,欢迎订阅、转发。

Machinelearning

@ai_machinelearning_big_data · Post #9506 · 02/12/2026, 07:00 AM

⚡️GLM-5 выкатили в опен-сорс. Не прошло и суток с момента релиза, а Zhipu AI выложила веса GLM-5 и любезно поделилась проведенными бенчмарками. Архитектура пятого поколения построена на MoE: 744 млрд. общих параметров при активных 40 млрд. Модель учили на 28,5 трлн. токенов и она получила контекстное окно в 200 тыс. токенов. GLM-5 ориентирован на 5 доменов: кодинг, рассуждение, агентные сценарии, генеративное творчество и работа с длинным контекстом. Для эффективной обработки длинных последовательностей интегрирован механизм Dynamically Sparse Attention от DeepSeek, он позволяет избежать квадратичного роста копьюта без потери качества. По бенчмаркам GLM-5 занимает 1 место среди open-source моделей: 77,8% на SWE-bench Verified, лидирует на Vending Bench 2, BrowseComp и MCP-Atlas, а в задачах агентного кодирования и рассуждений вплотную подбирается к Claude Opus 4.5 и GPT-5.2. Вместе с моделью, авторы предлагают Z Code — собственную агентную IDE с поддержкой параллельной работы нескольких агентов над одной задачей. Локальный деплой поддерживается vLLM и SGLang, а также non-NVIDIA чипами: Huawei Ascend, Moore Threads, Cambricon (через квантование и оптимизацию ядер). Если вам негде поднять модель локально, она доступна через платформу chat.z.ai, API и на OpenRouter. Квантованные версии пока сделали только Unsloth, традиционно - полный набор от 1-bit до BF16. И да, стэлс-модель PonyAlpha на OpenRouter - это она и была. 📌Лицензирование: MIT License. 🟡Статья 🟡Модель 🟡GGUF 🖥GitHub @ai_machinelearning_big_data #AI#ML#LLM#GLM5#ZAI