TGTGInsighttelegram intelligenceLIVE / telegram public index
Post content
Post content
我的 bold claim: 所有喜欢刷榜的 llm 都不行。甚至可以说,只要这家公司的主要宣传是在和别的公司比,这个model多半不行... 看到一个奇怪的决策的时候,我会下意识的去反推是什么样的mindset 让他们做出了这样的决定,然后推断他们受到什么压力,被什么因素驱动,是什么样的人,什么样的文化,以此来判断这家公司行不行。 盯着榜单刷,就和 paper counting 一样,会 distort your judgement.