TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
帖子内容
总结: A770 上基本只有 llama.cpp 能用 用 llama-bench 跑分时,Vulkan 后端分数显著高于 SYCL 后端。但实际运行 llama-server 时,prompt processing 根本到不了那个性能,处理只有一个 token 的 prompt 也要半分钟起步,有时候还会直接卡死。SYCL 性能基本符合 llama-bench 的数据。 不能使用 unsloth 的量化模型。测试了 unsloth 的 Q4 和 IQ4 量化 Gemma 4 26B-A4B、千问 3.5…