AI大模型在解决语言类问题时,表现很出色。但是,在解决数学问题时,通常比较糟糕。例如,在对2023年高考上海数学试卷进行测试时,百度文心一言、字节豆包和讯飞星火的正确率仅为63%,而阿里通义千问则全错得0分。通用大模型如ChatGPT和GPT-4在某些情况下可能仅能提供辅助性质的工作,如语义搜索和初步的推理。
在当前AI大模型还没有能力很好解决数学问题的情况下,最好的解决方法是让AI大模型智能的调用外部已经非常成熟可靠的数学计算器软件工具。Kimi就推出了这个功能,不过官方没有发布,官网也看不到,只有用户在问到数学相关问题时,才会出现。
比如问kimi:75和175的中间数是多少?
Kimi的回复:
75和175的中间数可以通过计算两者的平均值来得到。平均值的计算公式是:
中间数=75+175/2
按了计算器
75和175的中间数是125。
可见,这个数学问题不是kimi大模型本身来回答的,而是调用了计算器这个外部工具软件来回答的。
再试几个问题:
在“文化宜昌•全民阅读”活动中,某中学社团“精一读书社”对全校
学生的人数及纸质图书阅读量(单位:本)进行了调查,2012 年全校有 1000 名学生,2013 年全校学生人
数比 2012 年增加 10%,2014 年全校学生人数比 2013 年增加 100 人. 求 2014年全校学生人数;
- 乙两地相距189千米,一列快车从甲地开往乙地每小时行72千米,一列慢车从乙地去甲地每小时行54千米。若两车同时发车,几小时后两车相距31.5千米?
可以看到大部分情况下,kimi都可以很好的识别到问题是一个数学题目,然后会在计算过程中自动调用计算器。
不过,也有少部分情况,kimi可能不会调用计算器,而是用语言模型来推理。这个时候,我们在可以在提示词中加上一句话“注意:回答过程中要调用计算器” ,来让kimi调用计算器来解决问题。