TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
帖子内容
目前 TOP15 LLMs 的 Elo 评级随时间变化 https://public.flourish.studio/visualisation/16260210/ 最近 LMSYS 给出了目前排名前 15 的大型语言模型 Elo 评级随时间变化的动图,今年 5-12 月。OpenAI 的 GPT4 仍然一骑绝尘,Claude2 紧随其后。 值得一提的是,最近比较火的黑马开源模型 Mixtral-8x7b-Instruct-v0.1 已经超越 GPT-3.5-turbo 了,Gmini Pro 能力也和 GPT3.5 相差无几,未来可期。 引用链接 [1] 目前 AI 幻觉率(Hallucination)排名: https://t.me/isaiahsystem/1060 [2] OpenAI 与谷歌 AI 分庭抗礼丨仍无护城河: https://t.me/isaiahsystem/888 [3] 大型语言模型花园: https://t.me/isaiahsystem/927 #AI