TGTGInsighttelegram intelligenceLIVE / telegram public index
← 折腾实验室频道

TGINSIGHT SIMILAR POSTS

查找相似内容

Source channel @TossLabChannel · Post #582 · 2月9日

#DeepSeek#Dify#知识库#训练#AI模型 本地 DeepSeek 与 Dify 知识库对接,打造专属 AI 模型 视频亮点: • 深入介绍 DeepSeek 的操作流程 • Dify 知识库的整合方式 • 如何根据业务需求定制 AI 模型 • 实战演示如何训练本地 AI 模型 观看YouTube视频,掌握如何利用这些工具来提升自己的 AI 系统能力。 📢 群聊: @TossLab 🎈 频道: @TossLabChannel ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ ❗️ 🔘折腾系列频道 - 全面介绍 🔘境外离岸银行教程合集目录 🔘折腾实验室优质Github项目合集 🔘大流量卡三大运营商推荐合作店铺

Results

找到 10 条相似帖子

XP Digital Lab

@rocchl · Post #8621 · 2026/01/13 07:50

微软研报称 DeepSeek 在中国 AI 市场份额达 89%,在白俄罗斯达 56% 《金融时报》今天(1 月 13 日)发布博文,报道称微软总裁布拉德 · 史密斯(Brad Smith)表示,称中国正凭借“低成本开源模型 + 政府高额补贴”的组合拳, 在西方以外的国际市场赢得 AI 竞赛。 微软基于自身产品使用数据的最新研究显示, DeepSeek 发布的 R1 大语言模型因其“易用性与低成本”,加速了 AI 在全球的普及,尤其是在全球南方国家。 标签:#deepseek Created by RocM 官方频道:@rocCHL 官方群组:@roctech 官方合作:@rocmmbot

Hashtags

Yummy 😋

@godlynews1 · Post #13915 · 2025/10/20 11:16

DeepSeek开源3B 模型 DeepSeek-OCR 众所周知,当前所有 LLM 处理长文本时都面临一个绕不开的困境:计算复杂度是平方级增长的。序列越长,算力烧得越狠。 于是,DeepSeek 团队想到了一个好办法。既然一张图能包含大量文字信息,而且用的 Token 还少,那不如直接把文本转成图像?这就是所谓的「光学压缩」——用视觉模态来给文本信息「瘦身」。 论文显示,DeepSeek-OCR 的压缩率能达到 10 倍,OCR 准确率还能保持在 97% 以上。 也就是说,原本需要 1000 个文本 Token 才能表达的内容,现在只用 100 个视觉 Token 就搞定了。即使压缩率拉到 20 倍,准确率也还有 60% 左右,整体效果相当能打。 🗒 标签: #DeepSeek 📢 频道: @GodlyNews1 🤖 投稿: @GodlyNewsBot

Hashtags

🎉 Efficiency资源干货全收录

@Quanshoulu · Post #10139 · 2026/04/02 11:59

#AI#知识库 生产级 RAG(检索增强生成)系统,集成 ChromaDB 向量数据库,支持多种大模型(OpenAI、Claude、智谱AI、通义千问),用于智能文档问答 https://github.com/xiyue188/RAG

Yummy 😋

@godlynews1 · Post #15019 · 2026/03/18 04:07

DeepSeek又出手了?一个神秘的AI模型引起全球开发者热议 1万亿参数、100万token上下文窗口及免费访问策略 据路透社3月18日报道,一款名为“Hunter Alpha”的AI模型近日在开发者平台OpenRouter匿名上线,引发全球开发者社区关注。 该模型未标注开发者身份,但观察其性能参数与时间节点,市场猜测这可能是DeepSeek在正式发布前对其下一代系统进行的秘密测试。 Hunter Alpha于3月11日以“隐身模型”形式发布,且目前向开发者提供免费访问。测试显示,该系统具备1万亿参数规模和高达100万token的上下文窗口。 群友补充: 是小米家的 🗒 标签: #DeepSeek#AI 📢 频道: @GodlyNews1 🤖 投稿: @GodlyNewsBot

Hashtags

Yummy 😋

@godlynews1 · Post #14580 · 2026/01/01 15:06

梁文锋署名,DeepSeek元旦新论文要开启架构新篇章 DeepSeek提出了一种名为 mHC (流形约束超连接)的新架构,旨在解决传统超连接在大规模模型训练中的不稳定性问题,同时保持其显著的性能增益。 该架构通过将传统 Transformer 的单一残差流扩展为多流并行架构,并利用 Sinkhorn-Knopp算法将连接矩阵约束在双拟随机矩阵流形上,成功解决了超连接(HC)在大规模训练中因破坏恒等映射属性而导致的数值不稳定和信号爆炸问题。 这篇论文的第一作者有三位:Zhenda Xie(解振达)、Yixuan Wei(韦毅轩)、Huanqi Cao。值得注意的是,DeepSeek 创始人 & CEO 梁文锋也在作者名单中 🗒 标签: #DeepSeek#AI 📢 频道: @GodlyNews1 🤖 投稿: @GodlyNewsBot

Hashtags

Yummy 😋

@godlynews1 · Post #14260 · 2025/12/01 11:25

DeepSeekV3.2正式版发布 强化Agent能力 融入思考推理 DeepSeek宣布同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本目前仅以临时 API 服务形式开放,以供社区评测与研究。 DeepSeek-V3.2 的目标是平衡推理能力与输出长度,适合日常使用,例如问答场景和通用 Agent 任务场景。 DeepSeek-V3.2 的思考模式也增加了对 Claude Code 的支持,用户可以通过将模型名改为 deepseek-reasoner,或在 Claude Code CLI 中按 Tab 键开启思考模式进行使用。但需要注意的是,思考模式未充分适配 Cline、RooCode 等使用非标准工具调用的组件,我们建议用户在使用此类组件时继续使用非思考模式。 新模型技术报告 开源地址 DeepSeek-V3.2:HuggingFace / ModelScope DeepSeek-V3.2-Speciale: HuggingFace / ModelScope 🗒 标签: #DeepSeek#AI 📢 频道: @GodlyNews1 🤖 投稿: @GodlyNewsBot

Hashtags

订阅分享中心

@dingyue_Center · Post #2970 · 2025/02/01 13:16

#Ai free #deepseek 免费使用英伟达的671b顶级Deepseek-r1 模型5000次 https://blog1.dmit.us.kg/archives/nvidia-deepseek-r1 前一篇是某中转站的 GPT plus账号,大家可以对比下 或使用deepseek官网:https://chat.deepseek.com/ 就是有点卡

Hashtags

beng!

@mdmbeng · Post #2340 · 2025/01/28 08:24

#DeepSeek#AI 中国AI初创公司DeepSeek登顶App Store,引发市场震动 中国AI初创公司 DeepSeek 近期推出的AI助手应用程序迅速攀升至苹果App Store免费下载榜首,超越了OpenAI的ChatGPT等竞争对手。 DeepSeek声称,其最新的R1模型在推理能力上可与OpenAI的模型媲美,但开发成本仅为数百万美元,远低于美国公司数亿美元的投入。 这一消息引发了硅谷和华尔街的广泛关注,投资者担忧美国在AI领域的领先地位可能受到挑战。受此影响,Nvidia等美国科技巨头的股价大幅下跌。 与此同时,DeepSeek也面临着关于审查制度的质疑。外界指出,该AI助手在涉及中国政府的敏感话题时,存在自我审查的情况。此外,公司还报告称遭遇了大规模的网络攻击,导致新用户注册受到限制。 尽管如此,DeepSeek的迅速崛起显示了中国在AI技术领域的重大进展,并引发了对全球AI竞争格局的广泛讨论。 频道:@mdmbeng 投稿:@mdmbeng_Bot

Hashtags

AI一线|ShareCentre

@ShareCentre · Post #6930 · 2025/03/25 15:54

DeepSeek-V3-0324 发布,推理与代码能力全面升级 近日,DeepSeek AI 正式发布 DeepSeek-V3 模型的小版本升级——DeepSeek-V3-0324。新版本现已开放体验,用户可通过官方网页、App 和小程序关闭“深度思考”后使用,无需更改 API 接口和使用方式。 推理任务能力大幅提升,超越 GPT-4.5 DeepSeek-V3-0324 借鉴 DeepSeek-R1 在训练过程中使用的强化学习技术,在数学与代码相关任务的表现上实现显著提升。最新评测数据显示,在 MATH-500、AIME 2024、LiveCodeBench 等数据集上的表现超过 GPT-4.5,展现出更强的推理与代码生成能力。 前端开发与中文写作能力增强 在 HTML 和前端代码生成方面,DeepSeek-V3-0324 生成的代码可用性更高,视觉效果更加美观,富有设计感。同时,在中文写作任务上,新版本针对中长篇文本创作进行了优化,内容质量更上一层楼。 搜索与工具调用优化,体验更加流畅 新版 V3 模型在联网搜索场景下,对报告类任务的内容输出更加详实准确,排版更清晰。此外,工具调用、角色扮演、问答闲聊等多方面能力均有所提升,使对话体验更加流畅。 开源与私有化部署支持 DeepSeek-V3-0324 沿用 DeepSeek-V3 的 base 模型,仅优化后训练方法。私有化部署时,仅需更新 checkpoint 和 tokenizer_config.json,即可完成升级。模型参数规模约 660B,开源版本支持 128K 上下文长度(网页端、App 和 API 提供 64K)。 模型现已开源,并遵循 MIT License,允许用户利用模型输出或蒸馏训练其他模型。权重下载地址如下: - ModelScope: https://modelscope.cn/models/deepseek-ai/DeepSeek-V3-0324) - Huggingface: https://huggingface.co/deepseek-ai/DeepSeek-V3-0324 - 官方新闻稿: https://api-docs.deepseek.com/zh-cn/news/news250325 - 免费在线体验: chat.deepseek.com #DeepSeek#开源 Qwen又成了AI届的汪峰了