Post #644

@forbid_403

403 Forbidden

Visninger426Antal visninger

Publiceret8. apr.08.04.2026, 08.18

Indhold

Opslagsindhold

測試顯示 AI Overviews 每 10 個答案就有 1 個是錯的《紐約時報》的測試顯示，Google 搜尋的 AI 摘要功能 AI Overviews 每 10 個答案裡就有 1 個是錯的，這樣聽起來似乎還不錯，但考量到 Google 服務每天的搜尋量，這意味著每分鐘就有成千上萬則錯誤資訊被傳播出去。《紐約時報》與 Oumi 合作，利用 AI 工具透過 SimpleQA 評估 AI Overviews 答案的準確性。Oumi 從去年開始進行測試，當時 Google 最好的模型還是 Gemini 2.5，那時 AI Overviews 的準確性為 85%。當模型升級到 Gemini 3 後，AI Overviews 的準確性提升到 91%。AI Overviews 在提供答案時會列出引用來源，但當它出錯時，答案內容經常會與引用來源的資訊彼此矛盾。