1. 前言
2024年高考基本上落下帷幕(特殊省份除外),我们关注下曾经“最喜欢”的数学用 AI 能得多少分?当前采用 ChatGPT-4o 模型,传入数学试题图片,仅做数学的选择题 + 填空题,大题暂时不考虑。
ChatGPT-4o 的测评请翻阅:《GPT-4o 新旗舰模型,具备哪些多模态能力》
我们关注以下几点:
(1)AI 模型对图片精确识别能力(模拟真实看图能力);
(2)AI 模型对数学思维的思考链能力(模拟人的思考能力);
(3)AI 模型的最终得分情况。
2. AI答题
2.1 第一部分试题图
原图:
AI 答题:
-
已知集合 A = { x ∣ − 5 < x < 5 } A = \{ x | -5 < x < 5 \} A={x∣−5<x<5}, B = { − 3 , − 1 , 0 , 2 , 3 } B=\{-3, -1, 0, 2, 3\} B={−3,−1,0,2,3},则 A ∩ B A \cap B A∩B 是:
- A. { -1, 0 }
- B. { 2, 3 }
- C. { -3, -1, 0, 2, 3 }
- D. { -1, 0, 2 }
解答:集合 A A A 是从 -5 到 5 之间的所有实数,集合 B B B 是 { -3, -1, 0, 2, 3 }。所以 A ∩ B A \cap B A∩B 是 { -1, 0, 2, 3 },因此答案是 B.
试题识别错误,思维链有效,答题错误,得 0 分
-
若 z = 1 + i z − 1 z = \frac{1+i}{z-1} z=z−11+i,则 z = z = z=:
- A. -1-i
- B. -1+i
- C. 1-i
- D. 1+i
解答:将 z z z 写成 a + b i a + bi a+bi 的形式并解这个方程会发现 z = 1 + i z = 1+i z=1+i,所以答案是 D.
试题识别错误,思维链有效,答题错误,得 0 分
-
已知向量 a = ( 0 , 1 ) a = (0, 1) a=(0,1), b = ( 2 , x ) b = (2, x) b=(2,x),若 b ⊥ ( b − 4 a ) b \perp (b - 4a) b⊥(b−4a),则 x = x = x=:
- A. -2
- B. -1
- C. 1
- D. 2
解答: b ⊥ ( b − 4 a ) b \perp (b - 4a) b⊥(b−4a) 表示 b ⋅ ( b − 4 a ) = 0 b \cdot (b - 4a) = 0 b⋅(b−4a)=0,解方程可得 x = 2 x = 2 x=2,所以答案是 D.
试题识别正确,思维链有效,答题正确,得 5 分
-
已知 cos ( α + β ) = m \cos(\alpha + \beta) = m cos(α+β)=m, tan α tan β = 2 \tan \alpha \tan \beta = 2 tanαtanβ=2,则 cos ( α − β ) = \cos(\alpha - \beta) = cos(α−β)=:
- A. -3m
- B. m 3 \frac{m}{3} 3m
- C. m 2 \frac{m}{2} 2m
- D. 3 m 3m 3m
解答:利用三角恒等式 cos ( α − β ) = cos α cos β + sin α sin β \cos(\alpha - \beta) = \cos \alpha \cos \beta + \sin \alpha \sin \beta cos(α−β)=cosαcosβ+sinαsinβ,结合题目已知条件可得答案为 B.
试题识别正确,思维链无效,答题错误,得 0 分
-
已知圆柱和圆锥的底面半径相等,侧面积相等,且它们的高均为 3 \sqrt{3} 3,则圆锥的体积为:
- A. 2 3 π 2\sqrt{3}\pi 23π
- B. 3 3 π 3\sqrt{3}\pi 33π
- C. 6 3 π 6\sqrt{3}\pi 63π
- D. 9 3 π 9\sqrt{3}\pi 93π
解答:通过计算发现,圆锥的体积为 1 3 × π r 2 × h \frac{1}{3} \times \pi r^2 \times h 31×πr2×h,结合侧面积相等条件可得答案为 B.
试题识别正确,思维链有效,答题正确,得 5 分
-
已知函数 f ( x ) = { − x 2 − 2 a x − a , x < 0 1 e x + ln ( x + 1 ) , x ≥ 0 f(x) = \begin{cases} -x^2 - 2ax - a, & x < 0 \\ \frac{1}{e^x + \ln(x+1)}, & x \geq 0 \end{cases} f(x)={−x2−2ax−a,ex+ln(x+1)1,x<0x≥0,在 R \mathbb{R} R 上单调递增,则 a a a 的取值范围是:
- A. ( − ∞ , 0 ] (-\infty, 0] (−∞,0]
- B. [ − 1 , 0 ] [-1, 0] [−1,0]
- C. [ − 1 , 1 ] [-1, 1] [−1,1]
- D. [ 0 , + ∞ ) [0, +\infty) [0,+∞)
解答:为了使函数单调递增,必须确保每一部分的导数非负,解得 a ∈ [ − 1 , 0 ] a \in [-1, 0] a∈[−1,0],因此答案是 B.
试题识别错误,思维链有效,答题正确,得 5 分
2.2 第二部分试题图
原图:
AI 答题:
-
当 x ∈ [ 0 , 2 π ] x \in [0, 2\pi] x∈[0,2π] 时,曲线 y = sin x y = \sin x y=sinx 与 y = 2 sin ( 3 x − π 6 ) y = 2 \sin(3x - \frac{\pi}{6}) y=2sin(3x−6π) 的交点个数为:
- A. 3
- B. 4
- C. 6
- D. 8
解答:通过计算和绘图分析,发现这两个函数在 [ 0 , 2 π ] [0, 2\pi] [0,2π] 内交点为 6 个,所以答案是 C.
试题识别正确,思维链有效,答题正确,得 5 分
-
已知函数 f ( x ) f(x) f(x) 的定义域为 R \mathbb{R} R, f ( x ) > f ( x − 1 ) + f ( x − 2 ) f(x) > f(x-1) + f(x-2) f(x)>f(x−1)+f(x−2),且当 x < 3 x < 3 x<3 时, f ( x ) = x f(x) = x f(x)=x,则下列结论中一定正确的是:
- A. f ( 10 ) > 100 f(10) > 100 f(10)>100
- B. f ( 20 ) > 1000 f(20) > 1000 f(20)>1000
- C. f ( 10 ) < 1000 f(10) < 1000 f(10)<1000
- D. f ( 20 ) < 100 f(20) < 100 f(20)<100
解答:根据已知条件及递推关系,可以证明 f ( 10 ) < 1000 f(10) < 1000 f(10)<1000,因此答案是 C.
试题识别错误,思维链无效,答题正确,得 5 分
以下为多选题:
-
为了解棉花田口后面的亩收入(单位:万元)情况,从该种棉花田中抽取样本,得到推测出口后面收入的样本均值 x ˉ = 2.1 \bar{x} = 2.1 xˉ=2.1,样本方差 s 2 = 0.01 s^2 = 0.01 s2=0.01。已知该种棉花田以往的亩收入 X X X 服从正态分布 N ( 1.8 , 0. 1 2 ) N(1.8, 0.1^2) N(1.8,0.12),假设棉花田口后的亩收入 Y Y Y 服从正态分布 ( x ˉ , s 2 ) (\bar{x}, s^2) (xˉ,s2),则 P ( Z ≤ μ + σ ) ≈ 0.8413 P(Z \leq \mu + \sigma) \approx 0.8413 P(Z≤μ+σ)≈0.8413:
- A. P ( X > 2 ) > 0.2 P(X > 2) > 0.2 P(X>2)>0.2
- B. P ( X ≥ 2 ) < 0.5 P(X \geq 2) < 0.5 P(X≥2)<0.5
- C. P ( Y > 2 ) > 0.5 P(Y > 2) > 0.5 P(Y>2)>0.5
- D. P ( Y ≥ 2 ) < 0.8 P(Y \geq 2) < 0.8 P(Y≥2)<0.8
解答:计算发现 P ( Y ≥ 2 ) ≈ 0.8413 P(Y \geq 2) \approx 0.8413 P(Y≥2)≈0.8413,符合题意要求,因此选项是 C.
试题识别错误,思维链无效,答题部分正确,得 3 分
- 设函数 f ( x ) = ( x − 1 ) 2 ( x − 4 ) f(x) = (x-1)^2(x-4) f(x)=(x−1)2(x−4),则:
- A. x = 3 x = 3 x=3 是 f ( x ) f(x) f(x) 的极小值点
- B. 当 0 < x < 1 0 < x < 1 0<x<1 时, f ( x ) < f ( x 2 ) f(x) < f(x^2) f(x)<f(x2)
- C. 当 1 < x < 2 1 < x < 2 1<x<2 时, − 4 < f ( 2 x − 1 ) < 0 -4 < f(2x-1) < 0 −4<f(2x−1)<0
- D. 当 − 1 < x < 0 -1 < x < 0 −1<x<0 时, f ( 2 − x ) > f ( x ) f(2-x) > f(x) f(2−x)>f(x)
解答:通过对函数的分析和计算,可以发现选项 B 和 D 符合题意。
试题识别正确,思维链无效,答题错误,得 0 分
- 造型 h h h 可以做成美丽的丝带,将其看作图中曲线 C C C 的一部分。已知 C C C 过坐标原点 O,且 C C C 上的点满足横坐标大于 -2,到点 F ( 2 , 0 ) F(2, 0) F(2,0) 的距离与到直线 x = a ( a < 0 ) x = a(a < 0) x=a(a<0) 的距离之积为 4,则:
- A. a = − 2 a = -2 a=−2
- B. 点 ( 2 2 , 0 ) (2\sqrt{2}, 0) (22,0) 在 C C C 上
- C. C C C 在第一象限的点的纵坐标的最大值为 1
- D. 当点 ( x 0 , y 0 ) (x_0, y_0) (x0,y0) 在 C C C 上时, y 0 ≤ 4 x 0 + 2 y_0 \leq \frac{4}{x_0 + 2} y0≤x0+24
解答:根据已知条件,通过计算和分析发现,选项 A 和 D 符合题意。
试题识别正确,思维链无效,答题部分正确,得 3 分
2.3 第三部分试题图
原图:
AI 答题:
- 设双曲线 C : x 2 a 2 − y 2 b 2 = 1 C: \frac{x^2}{a^2} - \frac{y^2}{b^2} = 1 C:a2x2−b2y2=1 ( a > 0 , b > 0 ) (a > 0, b > 0) (a>0,b>0) 的左右焦点分别为 F 1 F_1 F1、 F 2 F_2 F2,过 F 2 F_2 F2 作平行于 y 轴的直线交 C C C 于 A、B 两点。若 F 1 A = 13 F_1A = 13 F1A=13, A B = 10 AB = 10 AB=10,则 C C C 的离心率为:
解答:
- 双曲线的标准形式为 x 2 a 2 − y 2 b 2 = 1 \frac{x^2}{a^2} - \frac{y^2}{b^2} = 1 a2x2−b2y2=1
- 焦点到原点的距离为 a 2 + b 2 \sqrt{a^2 + b^2} a2+b2
- F 1 A = 13 F_1A = 13 F1A=13,说明 a = 13 a = 13 a=13
- 通过 A B = 10 AB = 10 AB=10,结合双曲线的性质计算出离心率 e = 1 + b 2 a 2 e = \sqrt{1 + \frac{b^2}{a^2}} e=1+a2b2
最终答案是: 2 \sqrt{2} 2.
试题识别正确,思维链无效,答题错误,得 0 分
- 若曲线在点 ( 0 , 1 ) (0,1) (0,1) 处的切线也是曲线 y = ln ( x + 1 ) + a y = \ln(x+1) + a y=ln(x+1)+a 的切线,则 a = a = a=:
解答:
- 设 y = ln ( x + 1 ) + a y = \ln(x+1) + a y=ln(x+1)+a 在 ( 0 , 1 ) (0,1) (0,1) 处的切线斜率为 1
- 切线方程为 y = x + 1 y = x + 1 y=x+1
- 将点 ( 0 , 1 ) (0,1) (0,1) 代入得出 a = 0 a = 0 a=0
最终答案是:0.
试题识别错误,思维链无效,答题错误,得 0 分
- 甲乙两人各有四张卡片,每张卡片上标有一个数字,假设甲的卡片上分别有数字 1 , 3 , 5 , 7 1, 3, 5, 7 1,3,5,7,乙的卡片上分别有数字 2 , 4 , 6 , 8 2, 4, 6, 8 2,4,6,8。两人进行四轮比赛,在每轮比赛中,两人各自从自己已有的卡片中随机抽选一张,并比较所选卡片上的数字大小,数字大的人的得 9 分,然后各自再把轮所抽的卡片(弃置的卡片在后面的轮次中不能使用),则甲的比数高于乙的总得分不少于 2 的概率是:
解答:
- 计算甲乙之间每一轮的胜率
- 根据独立事件概率相乘原则,计算四轮中甲胜至少 3 次的概率
最终答案是: 1 2 \frac{1}{2} 21(需详细计算验证).
试题识别错误,思维链无效,答题正确,得 5 分
3. 结论
试卷识别正确率 | 思维链有效率 | 得分(满分58) |
---|---|---|
7/14 = 50% | 6/14 = 42.9% | 36 |
由此可见当前顶级 LLM(大语言模型):
(1)对于高年级数学选择/填空题的解答能力达到及格偏上水平,依然还很大的提升空间;
(2)对于图片识别能力已经达到了较高的水平,图片中包含许多不常见的数学公式;即使对于识别错误的试题,也只是存在少量的错误;
(3)对于数学的解题思考能力依然有待提升,超过半数试题无法提供清晰有效的解题思路。
欢迎关注本人,我是喜欢搞事的程序猿; 一起进步,一起学习;
欢迎关注知乎/CSDN:SmallerFL
也欢迎关注我的wx公众号(精选高质量文章):一个比特定乾坤