TGTGInsighttelegram intelligenceLIVE / telegram public index
← 404 KIDS SEE GHOSTS (生产力之王版
404 KIDS SEE GHOSTS (生产力之王版 avatar

TGINSIGHT POST

Post #1164

@Isaiahsystem

404 KIDS SEE GHOSTS (生产力之王版

Views5,880帖子阅读量
发布4月5日2024/04/05 04:16
Post content

帖子内容

AI Leaderboard丨关于 AI 及语言模型的各大排行榜 最近发现个「人工智能公司排行榜」,想起之前分享和接触了不少 AI 相关排行榜,这也是观看所有 AI 信息的注意力基础,目前 AI 发展程度。所以推出本专题。 🏆LMSYS Chatbot Arena Leaderboard LMSYS Org(Large Model Systems Organization),最为知名的目前大型语言模型的埃洛评级(Elo Rating)监测,分享过多次。目前该排名值得关注的是 Claude 3 Opus 仍然排名第一,并且其更便宜模型 Claude 3 Haiku 也超过了部分 GPT4 模型。 The top AI companies in 2024 该网站综合评估选出了目前 TOP100 从事 AI 模型研究和应用的公司。Hugging Face(抱脸)凭借其强大的开源开发者社区支持,提供大量的预训练模型和数据集和相关资源综合排名第一,抱脸还有很多有意思的排名,如模型竞技场排名/最佳 AI 内容贡献者等都值得关注;第二名 Databricks 是家专注大数据处理的 AI 公司,通用开源的大型语言模型 DBRX 即由它们创建。后面跟着的是之前提到的法国黑马 AI 初创公司 MISTRAL 以及 OPENAI。 Hallucination Leaderboard 这是我之前分享过的目前 AI 幻觉率(Hallucination)排名。截止今年3月底,目前幻觉率最低 TOP 出现个 Intel Neural Chat 7B,其次 GPT4 幻觉处理仍然很好。 SuperCLUE总排行榜(2024年2月) 第三个排行榜分享「SuperCLUE:中文通用大模型综合性测评基准」排名,亲中文排行榜,包括古诗/文学/歇后语和方言等测试排名。除去 GPT4,排名靠前的即国内文心一言/智谱AI/通义千问等。 OpenRouter LLM Rankings 大型语言模型使用接口排行榜和数据,有免费版本以及付费。 AI Model Translation Arena AI 模型翻译质量和 Token 使用耗费排行榜。 AI产品数据 --- 还有些排行榜已经停止更新,这个榜单将持续补充。 相关链接 1 中国大模型列表 Awesome LLMs In China 2 Introducing DBRX: A New State-of-the-Art Open LLM 3 OpenAI 与谷歌 AI 分庭抗礼丨仍无护城河 Sponsor 本条内容由 Aizex 合租面板赞助支持,口碑 ChatGPT Plus 拼车服务:https://t.me/isaiahsystem/1155 #AI