骑海绵宝宝のman (@idealy) 在 简单记录AI在编程问题是否听话导致的区别 中发帖
参加模型:DeepSeek R1、豆包、Gemini 3
DeepSeek :基本听话 且如果遇到指令或方案觉得不合理会推荐你采用其他方案。
豆包:选择性听话 经常偷梁换柱,遇到指定的指令或方案觉得不合理(或过于复杂)会偷换其中的部分逻辑,并且不做提示,不认真审查容易错过,反复强调后才能按照指定方式输出。
Gemini 3 pro:太听话了 但是输出的代码质量、可用性和案精度有待提升。
例子就不放出来了,这里测试的指令都是一样的,
宇宙安全声明:未作大量测试,且大部分为个人感知,仅作记录。
详情链接:
https://linux.do/t/topic/1330485/1
来源: LINUX DO, 消息ID: 262639
爱站程序员基地
![@saber2480 在 这个二手苹果买贵了? 中发帖
到是想买一个低系统来玩巨魔 佬们 买贵了吗
[1a4a2c3b1158a17198fd684c1e0f5bb9_720]-爱站程序员基地](https://aiznh.com/wp-content/uploads/2021/05/1-220x150.jpeg)

