TGTGInsighttelegram intelligenceLIVE / telegram public index
← 网络安全笔记
网络安全笔记 avatar

TGINSIGHT POST

Post #1406

@tsecrecord

网络安全笔记

Views3,510帖子阅读量
发布2月17日2025/02/17 06:36
Post content

帖子内容

文章通过实验展示了在开源LLM中嵌入后门的可能性,并强调了嵌入风险的隐蔽性和检测的困难性。作者呼吁在使用LLM时保持警惕,无论其是否开源,并期待AI研究者开发出有效的检测和缓解方法。 #AI https://blog.sshh.io/p/how-to-backdoor-large-language-models https://github.com/sshh12/llm_backdoor?tab=readme-ov-file