Post #7172

@ClickMeToBecomeSaltedFish

咸咸湿湿

Views67帖子阅读量

发布4月16日2026/04/16 04:16

Post content

帖子内容

总结： A770 上基本只有 llama.cpp 能用用 llama-bench 跑分时，Vulkan 后端分数显著高于 SYCL 后端。但实际运行 llama-server 时，prompt processing 根本到不了那个性能，处理只有一个 token 的 prompt 也要半分钟起步，有时候还会直接卡死。SYCL 性能基本符合 llama-bench 的数据。不能使用 unsloth 的量化模型。测试了 unsloth 的 Q4 和 IQ4 量化 Gemma 4 26B-A4B、千问 3.5…