标签

2026四月末AI能否解原创高中题?实测三款主流模型,豆包表现最佳

无论是学生还是人工智能,敷衍了事永远比不上脚踏实地文/Logo作者本次测试的选手包括:豆包(专家版)、千问(3.5思考版)和ChatGPT(5.4thinking版)。它们代表了不同的主流大模型:国内C端用户霸主、企业级AI专家以及被视为标杆的闭源巨头。(开源DeepseekV4仍不支持图像识别)然而对于学生而言,这其实没那么复杂。他们不关心参数或架构,也不关心谁在发布会上故事讲得好,或者指标登了几个榜首。真正重要的是一件事:哪款AI更适合实际应用。这正是本次测试旨在回答的问题。不过,我们不能直接使用高考

2026-05-04 18:41:26  |  5 阅读