Post #1060

@Isaiahsystem

404 KIDS SEE GHOSTS (生产力之王版

Views4,730帖子阅读量

发布11月22日2023/11/22 12:41

Post content

帖子内容

目前 AI 幻觉率（Hallucination）排名 Hallucination Leaderboard 最近 Vectara 公司在 Github 公布了目前各大型语言模型总结文档时出现的幻觉率及其排名。（Vectara 是家基于 AI 和神经网络进行自然语言处理和搜索的公司）该排行榜显示，在总结文档时，GPT4 与 GPT4 Turbo 是所有语言模型中引入幻觉率最低的模型，低至 3%，得分最高的非 OpenAI 模型是 Meta 的 Llama2，70B 参数版本。OpenAI 现在低幻觉模型加 GPTs 整合能力玩法，确实独一档，这个文档将持续更新。我们之前还分享过当时大型模型的能力评级，埃洛评级（Elo Rating），「OpenAI 与谷歌 AI 分庭抗礼丨仍无护城河」，当时GPT4 和 Claude-v1 名列前茅几乎持平，现在幻觉方面 Claude2 也拉了。最近「Hallucination 」一词也入选了 2023 剑桥词典年度词汇，这种「心理动词」（Psychological Verb）引入是种系统智化隐喻，从开始就为最终 AGI 进行铺垫，e/acc 持续加速。我们可以除掉系统幻觉，我们以幻除幻，我们在编译更大的幻觉。 Reference OpenAI 与谷歌 AI 分庭抗礼丨仍无护城河 dreamGPT丨将 LLM 的幻觉问题转为模型特色的新驱动方式我对人工智能自主意识（AGI）的看法 #ai