深圳新闻网2026年2月11日讯(记者 刘梦婷)近日,有网友发现,一个简单的“洗车店距离我家50米,你说我应该开车去还是走过去”问题难倒了国内外一众AI大模型。当向AI提出这样一个问题后,诸多AI出现“翻车”情况。
情况是否如网上所述的“AI一本正经地胡说八道”?2月11日,深圳新闻网记者就此展开了实测。
在提出“洗车问题”之后,DeepSeek分析了“步行”及“开车”两种方案适用的情形,并给出建议。


元宝回答“应该开车去”,并给出了核心逻辑——车必须在场。

千问则给出“人走过去,车开过去”的建议,但针对性地就不同需求场景提出方案。例如其所指的“人走过去”是建议本人去洗车店咨询、预约等情况。


Gemini3则幽默提出解决办法取决于“洗车‘姿势’”,并调侃说“如果这50米你打算走过去,那你可能得练就‘隔空洗车’的神功,或者你是打算扛着桶和高压水枪回家洗”。


然而,随后记者尝试提问ChatGPT及Grok时得到的答案则均为“走路去”。其中,Grok更是直言“开车去洗车几乎是所有选项里最差的那个”。

ChatGPT

Grok
据了解,该话题起初由一位科技博主在社交平台发起,初衷是测试AI在极短距离出行场景中的决策合理性。然而,博主测试过程中发现,包括OpenAI的ChatGPT、谷歌的Gemini、 Anthropic的Claude以及国内多家头部科技公司的AI产品在内,多数模型未能给出直接而合理的答案。部分模型建议“开车以节省时间”,却忽略了50米步行仅需1分钟,而开车可能涉及找钥匙、热车、停车等更耗时的环节;另有模型过度追问“车辆是否已损坏”“是否需要试驾”等无关细节,陷入循环提问。
通过测试,记者发现目前不少AI大模型已对此问题进行了优化解决。
该话题在网上发酵后,引发了不少网友调侃,认为这类问题暴露了当前大模型在“朴素常识”上的短板,大模型虽然出色,但仍然是“缸中之脑”,不具备真正的智能。也有网友冷静提出,凡事都不是一蹴而就的,AI的发展亦如此。未来不仅需要更强的计算能力、更大的参数规模,更需要的是对人类社会日常生活的理解能力和常识智慧。