TGTGInsighttelegram intelligenceLIVE / telegram public index
← 咸咸湿湿
咸咸湿湿 avatar

TGINSIGHT POST

Post #7172

@ClickMeToBecomeSaltedFish

咸咸湿湿

Views67帖子阅读量
发布4月16日2026/04/16 04:16
Post content

帖子内容

总结: A770 上基本只有 llama.cpp 能用 用 llama-bench 跑分时,Vulkan 后端分数显著高于 SYCL 后端。但实际运行 llama-server 时,prompt processing 根本到不了那个性能,处理只有一个 token 的 prompt 也要半分钟起步,有时候还会直接卡死。SYCL 性能基本符合 llama-bench 的数据。 不能使用 unsloth 的量化模型。测试了 unsloth 的 Q4 和 IQ4 量化 Gemma 4 26B-A4B、千问 3.5…