TGTGInsighttelegram intelligenceLIVE / telegram public index
返回频道列表
咸咸湿湿 avatar

TGINSIGHT CHAT

咸咸湿湿

@ClickMeToBecomeSaltedFish

新闻与媒体

最💗新💗最💗热💗咸💗鱼💗资💗讯

Subscribers183频道当前订阅规模
Tracked posts1,008频道帖子计数
Recent reach1,353最近帖子视图总和
Recent posts

最近帖子

第 12/84 页 · 共 1,008 条

发布 4月28日

跑起来了

83 views

发布 4月28日

source

531 views

发布 4月28日

这世上还是好人多鸭.jpg 我就说这种问题 Strix Halo 用户肯定也逃不掉(x

69 views

发布 4月28日

啧 HuggingFace 那个 transformers 库对 GB10 很不友好啊。它默认会 mmap 文件,这在 RAM VRAM 互相独立的时候无所谓,但在 GB10 上会导致它最多只能载入空闲内存一半大的模型。

71 views

发布 4月27日

https://dbrand.com/shop/limited-edition/companion-cube 挖,送我!

69 views

发布 4月27日

sys��if 🤔

71 views

发布 4月27日

老黄设备里就 GB10 是统一内存空间的 毕竟 GB10 不配用 HBM

74 views

发布 4月27日

老黄官方口径是所有 Grace Blackwell 设备里就 GB10 不配使用 GDS/GDS RDMA。但实际上已经有网友确定了 cuFile 能用,RDMA 估计也能搞出来。 反正问就是老黄等级森严。

72 views

发布 4月27日

我想等 Qwen3.6 122B-A10B 出来的时候自己跑一个量化,想着在它发布之前先本地量化一个更小的模型试试看能不能跑通这个流程。 结果 35B-A3B 差不多正好比我内存一半大一点,唉老黄。

72 views

发布 4月27日

啧 HuggingFace 那个 transformers 库对 GB10 很不友好啊。它默认会 mmap 文件,这在 RAM VRAM 互相独立的时候无所谓,但在 GB10 上会导致它最多只能载入空闲内存一半大的模型。

75 views

发布 4月27日

在 GB10 上干掉 vLLM 后不会自动释放被显存占用的空间。之前一直以为是主线内核里缺东西了,想着反正也没多麻烦就直接重启了。 今天重新搜了一下,在一个奇怪网站上找到了疑似官方的 workaround:只需要 echo 3 > /proc/sys/vm/drop_caches 就行了。ber,这设计合理吗?怎么会是这个 sysctl 端点? https://nvidia.custhelp.com/app/answers/detail/a_id/5728/~/unexpected-available…

84 views

发布 4月27日

在 GB10 上干掉 vLLM 后不会自动释放被显存占用的空间。之前一直以为是主线内核里缺东西了,想着反正也没多麻烦就直接重启了。 今天重新搜了一下,在一个奇怪网站上找到了疑似官方的 workaround:只需要 echo 3 > /proc/sys/vm/drop_caches 就行了。ber,这设计合理吗?怎么会是这个 sysctl 端点? https://nvidia.custhelp.com/app/answers/detail/a_id/5728/~/unexpected-available-memory-reporting-on-dgx-spark

82 views
12•••5•••101112131415•••20•••25•••30•••35•••40•••45•••50•••55•••60•••65•••70•••75•••80•••8384