AI智能
改变未来

Stephen (@KaylonChan) 在 没想到幻觉率最低的竟然是 Claude ?而且遥遥领先 中发帖 最近在看一部小说,于是突发奇想,就像测试一下 AI 的联网搜索能力,看能不能准确…

Stephen (@KaylonChan) 在 没想到幻觉率最低的竟然是 Claude ?而且遥遥领先 中发帖

最近在看一部小说,于是突发奇想,就像测试一下 AI 的联网搜索能力,看能不能准确找到信息,回答这种信息源很少的问题,以及如果找不到,幻觉会如何

测试了目前最顶级的三家模型, Claude, GPT, Gemini ,使用完全一样的提示词,如下,没有显示提醒需要联网搜索,也没有打开联网功能

作者:肤浅失眠中
书名:《那些热血飞扬的日子》

我想知道,里面的角色:叶倾城,与主角“我”(张成)之间详细的关系发展
以及最后,叶倾城是否恢复记忆?

最终结果:

Claude Sonnet 4.5

搜索 3 轮,每次 10 个网页,每次根据搜索结果思考是否继续下次搜索
回答的信息完全正确,搜索到了正确的网页
幻觉率 0%
[Screenshot 2025-12-21 at 08.04.59]

GPT 5.2 thinking

搜索 11 轮,但是搜索效率低,每次只搜索 1…

详情链接:
https://linux.do/t/topic/1346296/1

来源: LINUX DO, 消息ID: 264134

赞(0) 打赏
未经允许不得转载:爱站程序员基地 » Stephen (@KaylonChan) 在 没想到幻觉率最低的竟然是 Claude ?而且遥遥领先 中发帖 最近在看一部小说,于是突发奇想,就像测试一下 AI 的联网搜索能力,看能不能准确…