TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
帖子内容
目前 AI 幻觉率(Hallucination)排名 Hallucination Leaderboard 最近 Vectara 公司在 Github 公布了目前各大型语言模型总结文档时出现的幻觉率及其排名。(Vectara 是家基于 AI 和神经网络进行自然语言处理和搜索的公司) 该排行榜显示,在总结文档时,GPT4 与 GPT4 Turbo 是所有语言模型中引入幻觉率最低的模型,低至 3%,得分最高的非 OpenAI 模型是 Meta 的 Llama2,70B 参数版本。OpenAI 现在低幻觉模型加 GPTs 整合能力玩法,确实独一档,这个文档将持续更新。 我们之前还分享过当时大型模型的能力评级,埃洛评级(Elo Rating),「OpenAI 与谷歌 AI 分庭抗礼丨仍无护城河」,当时GPT4 和 Claude-v1 名列前茅几乎持平,现在幻觉方面 Claude2 也拉了。 最近「Hallucination 」一词也入选了 2023 剑桥词典年度词汇,这种「心理动词」(Psychological Verb)引入是种系统智化隐喻,从开始就为最终 AGI 进行铺垫,e/acc 持续加速。我们可以除掉系统幻觉,我们以幻除幻,我们在编译更大的幻觉。 Reference OpenAI 与谷歌 AI 分庭抗礼丨仍无护城河 dreamGPT丨将 LLM 的幻觉问题转为模型特色的新驱动方式 我对人工智能自主意识(AGI)的看法 #ai