TGTGInsighttelegram intelligenceLIVE / telegram public index
Indhold
Opslagsindhold
測試顯示 AI Overviews 每 10 個答案就有 1 個是錯的 《紐約時報》的測試顯示,Google 搜尋的 AI 摘要功能 AI Overviews 每 10 個答案裡就有 1 個是錯的,這樣聽起來似乎還不錯,但考量到 Google 服務每天的搜尋量,這意味著每分鐘就有成千上萬則錯誤資訊被傳播出去。《紐約時報》與 Oumi 合作,利用 AI 工具透過 SimpleQA 評估 AI Overviews 答案的準確性。Oumi 從去年開始進行測試,當時 Google 最好的模型還是 Gemini 2.5,那時 AI Overviews 的準確性為 85%。當模型升級到 Gemini 3 後,AI Overviews 的準確性提升到 91%。AI Overviews 在提供答案時會列出引用來源,但當它出錯時,答案內容經常會與引用來源的資訊彼此矛盾。