TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
帖子内容
Matthias Plappert这个发现很有意思: 1. 他在HumanEval上对几个LLMs进行了基准测试,特别是在pass@1(不知道是啥)上。他的侧重是代码生成方面的比较。 https://twitter.com/dotey/status/1664345808961937426?s=20
Matthias Plappert这个发现很有意思: 1. 他在HumanEval上对几个LLMs进行了基准测试,特别是在pass@1(不知道是啥)上。他的侧重是代码生成方面的比较。 https://twitter.com/dotey/status/1664345808961937426?s=20