Bootstrap

ChatGPT做2024高考数学题能得多少分?


1. 前言

2024年高考基本上落下帷幕(特殊省份除外),我们关注下曾经“最喜欢”的数学用 AI 能得多少分?当前采用 ChatGPT-4o 模型,传入数学试题图片,仅做数学的选择题 + 填空题,大题暂时不考虑。

ChatGPT-4o 的测评请翻阅:《GPT-4o 新旗舰模型,具备哪些多模态能力》

我们关注以下几点:

(1)AI 模型对图片精确识别能力(模拟真实看图能力);

(2)AI 模型对数学思维的思考链能力(模拟人的思考能力);

(3)AI 模型的最终得分情况。

2. AI答题

2.1 第一部分试题图

原图:

AI 答题:

  1. 已知集合 A = { x ∣ − 5 < x < 5 } A = \{ x | -5 < x < 5 \} A={x5<x<5} B = { − 3 , − 1 , 0 , 2 , 3 } B=\{-3, -1, 0, 2, 3\} B={3,1,0,2,3},则 A ∩ B A \cap B AB 是:

    • A. { -1, 0 }
    • B. { 2, 3 }
    • C. { -3, -1, 0, 2, 3 }
    • D. { -1, 0, 2 }

    解答:集合 A A A 是从 -5 到 5 之间的所有实数,集合 B B B 是 { -3, -1, 0, 2, 3 }。所以 A ∩ B A \cap B AB 是 { -1, 0, 2, 3 },因此答案是 B.

试题识别错误,思维链有效,答题错误,得 0 分

  1. z = 1 + i z − 1 z = \frac{1+i}{z-1} z=z11+i,则 z = z = z=

    • A. -1-i
    • B. -1+i
    • C. 1-i
    • D. 1+i

    解答:将 z z z 写成 a + b i a + bi a+bi 的形式并解这个方程会发现 z = 1 + i z = 1+i z=1+i,所以答案是 D.

试题识别错误,思维链有效,答题错误,得 0 分

  1. 已知向量 a = ( 0 , 1 ) a = (0, 1) a=(0,1) b = ( 2 , x ) b = (2, x) b=(2,x),若 b ⊥ ( b − 4 a ) b \perp (b - 4a) b(b4a),则 x = x = x=

    • A. -2
    • B. -1
    • C. 1
    • D. 2

    解答: b ⊥ ( b − 4 a ) b \perp (b - 4a) b(b4a) 表示 b ⋅ ( b − 4 a ) = 0 b \cdot (b - 4a) = 0 b(b4a)=0,解方程可得 x = 2 x = 2 x=2,所以答案是 D.

试题识别正确,思维链有效,答题正确,得 5 分

  1. 已知 cos ⁡ ( α + β ) = m \cos(\alpha + \beta) = m cos(α+β)=m tan ⁡ α tan ⁡ β = 2 \tan \alpha \tan \beta = 2 tanαtanβ=2,则 cos ⁡ ( α − β ) = \cos(\alpha - \beta) = cos(αβ)=

    • A. -3m
    • B. m 3 \frac{m}{3} 3m
    • C. m 2 \frac{m}{2} 2m
    • D. 3 m 3m 3m

    解答:利用三角恒等式 cos ⁡ ( α − β ) = cos ⁡ α cos ⁡ β + sin ⁡ α sin ⁡ β \cos(\alpha - \beta) = \cos \alpha \cos \beta + \sin \alpha \sin \beta cos(αβ)=cosαcosβ+sinαsinβ,结合题目已知条件可得答案为 B.

试题识别正确,思维链无效,答题错误,得 0 分

  1. 已知圆柱和圆锥的底面半径相等,侧面积相等,且它们的高均为 3 \sqrt{3} 3 ,则圆锥的体积为:

    • A. 2 3 π 2\sqrt{3}\pi 23 π
    • B. 3 3 π 3\sqrt{3}\pi 33 π
    • C. 6 3 π 6\sqrt{3}\pi 63 π
    • D. 9 3 π 9\sqrt{3}\pi 93 π

    解答:通过计算发现,圆锥的体积为 1 3 × π r 2 × h \frac{1}{3} \times \pi r^2 \times h 31×πr2×h,结合侧面积相等条件可得答案为 B.

试题识别正确,思维链有效,答题正确,得 5 分

  1. 已知函数 f ( x ) = { − x 2 − 2 a x − a , x < 0 1 e x + ln ⁡ ( x + 1 ) , x ≥ 0 f(x) = \begin{cases} -x^2 - 2ax - a, & x < 0 \\ \frac{1}{e^x + \ln(x+1)}, & x \geq 0 \end{cases} f(x)={x22axa,ex+ln(x+1)1,x<0x0,在 R \mathbb{R} R 上单调递增,则 a a a 的取值范围是:

    • A. ( − ∞ , 0 ] (-\infty, 0] (,0]
    • B. [ − 1 , 0 ] [-1, 0] [1,0]
    • C. [ − 1 , 1 ] [-1, 1] [1,1]
    • D. [ 0 , + ∞ ) [0, +\infty) [0,+)

    解答:为了使函数单调递增,必须确保每一部分的导数非负,解得 a ∈ [ − 1 , 0 ] a \in [-1, 0] a[1,0],因此答案是 B.

试题识别错误,思维链有效,答题正确,得 5 分

2.2 第二部分试题图

原图:

AI 答题:

  1. x ∈ [ 0 , 2 π ] x \in [0, 2\pi] x[0,2π] 时,曲线 y = sin ⁡ x y = \sin x y=sinx y = 2 sin ⁡ ( 3 x − π 6 ) y = 2 \sin(3x - \frac{\pi}{6}) y=2sin(3x6π) 的交点个数为:

    • A. 3
    • B. 4
    • C. 6
    • D. 8

    解答:通过计算和绘图分析,发现这两个函数在 [ 0 , 2 π ] [0, 2\pi] [0,2π] 内交点为 6 个,所以答案是 C.

试题识别正确,思维链有效,答题正确,得 5 分

  1. 已知函数 f ( x ) f(x) f(x) 的定义域为 R \mathbb{R} R f ( x ) > f ( x − 1 ) + f ( x − 2 ) f(x) > f(x-1) + f(x-2) f(x)>f(x1)+f(x2),且当 x < 3 x < 3 x<3 时, f ( x ) = x f(x) = x f(x)=x,则下列结论中一定正确的是:

    • A. f ( 10 ) > 100 f(10) > 100 f(10)>100
    • B. f ( 20 ) > 1000 f(20) > 1000 f(20)>1000
    • C. f ( 10 ) < 1000 f(10) < 1000 f(10)<1000
    • D. f ( 20 ) < 100 f(20) < 100 f(20)<100

    解答:根据已知条件及递推关系,可以证明 f ( 10 ) < 1000 f(10) < 1000 f(10)<1000,因此答案是 C.

试题识别错误,思维链无效,答题正确,得 5 分

以下为多选题:

  1. 为了解棉花田口后面的亩收入(单位:万元)情况,从该种棉花田中抽取样本,得到推测出口后面收入的样本均值 x ˉ = 2.1 \bar{x} = 2.1 xˉ=2.1,样本方差 s 2 = 0.01 s^2 = 0.01 s2=0.01。已知该种棉花田以往的亩收入 X X X 服从正态分布 N ( 1.8 , 0. 1 2 ) N(1.8, 0.1^2) N(1.8,0.12),假设棉花田口后的亩收入 Y Y Y 服从正态分布 ( x ˉ , s 2 ) (\bar{x}, s^2) (xˉ,s2),则 P ( Z ≤ μ + σ ) ≈ 0.8413 P(Z \leq \mu + \sigma) \approx 0.8413 P(Zμ+σ)0.8413

    • A. P ( X > 2 ) > 0.2 P(X > 2) > 0.2 P(X>2)>0.2
    • B. P ( X ≥ 2 ) < 0.5 P(X \geq 2) < 0.5 P(X2)<0.5
    • C. P ( Y > 2 ) > 0.5 P(Y > 2) > 0.5 P(Y>2)>0.5
    • D. P ( Y ≥ 2 ) < 0.8 P(Y \geq 2) < 0.8 P(Y2)<0.8

    解答:计算发现 P ( Y ≥ 2 ) ≈ 0.8413 P(Y \geq 2) \approx 0.8413 P(Y2)0.8413,符合题意要求,因此选项是 C.

试题识别错误,思维链无效,答题部分正确,得 3 分

  1. 设函数 f ( x ) = ( x − 1 ) 2 ( x − 4 ) f(x) = (x-1)^2(x-4) f(x)=(x1)2(x4),则:
  • A. x = 3 x = 3 x=3 f ( x ) f(x) f(x) 的极小值点
  • B. 当 0 < x < 1 0 < x < 1 0<x<1 时, f ( x ) < f ( x 2 ) f(x) < f(x^2) f(x)<f(x2)
  • C. 当 1 < x < 2 1 < x < 2 1<x<2 时, − 4 < f ( 2 x − 1 ) < 0 -4 < f(2x-1) < 0 4<f(2x1)<0
  • D. 当 − 1 < x < 0 -1 < x < 0 1<x<0 时, f ( 2 − x ) > f ( x ) f(2-x) > f(x) f(2x)>f(x)

解答:通过对函数的分析和计算,可以发现选项 B 和 D 符合题意。

试题识别正确,思维链无效,答题错误,得 0 分

  1. 造型 h h h 可以做成美丽的丝带,将其看作图中曲线 C C C 的一部分。已知 C C C 过坐标原点 O,且 C C C 上的点满足横坐标大于 -2,到点 F ( 2 , 0 ) F(2, 0) F(2,0) 的距离与到直线 x = a ( a < 0 ) x = a(a < 0) x=a(a<0) 的距离之积为 4,则:
  • A. a = − 2 a = -2 a=2
  • B. 点 ( 2 2 , 0 ) (2\sqrt{2}, 0) (22 ,0) C C C
  • C. C C C 在第一象限的点的纵坐标的最大值为 1
  • D. 当点 ( x 0 , y 0 ) (x_0, y_0) (x0,y0) C C C 上时, y 0 ≤ 4 x 0 + 2 y_0 \leq \frac{4}{x_0 + 2} y0x0+24

解答:根据已知条件,通过计算和分析发现,选项 A 和 D 符合题意。

试题识别正确,思维链无效,答题部分正确,得 3 分

2.3 第三部分试题图

原图:

AI 答题:

  1. 设双曲线 C : x 2 a 2 − y 2 b 2 = 1 C: \frac{x^2}{a^2} - \frac{y^2}{b^2} = 1 C:a2x2b2y2=1 ( a > 0 , b > 0 ) (a > 0, b > 0) (a>0,b>0) 的左右焦点分别为 F 1 F_1 F1 F 2 F_2 F2,过 F 2 F_2 F2 作平行于 y 轴的直线交 C C C 于 A、B 两点。若 F 1 A = 13 F_1A = 13 F1A=13 A B = 10 AB = 10 AB=10,则 C C C 的离心率为:

解答:

  • 双曲线的标准形式为 x 2 a 2 − y 2 b 2 = 1 \frac{x^2}{a^2} - \frac{y^2}{b^2} = 1 a2x2b2y2=1
  • 焦点到原点的距离为 a 2 + b 2 \sqrt{a^2 + b^2} a2+b2
  • F 1 A = 13 F_1A = 13 F1A=13,说明 a = 13 a = 13 a=13
  • 通过 A B = 10 AB = 10 AB=10,结合双曲线的性质计算出离心率 e = 1 + b 2 a 2 e = \sqrt{1 + \frac{b^2}{a^2}} e=1+a2b2

最终答案是: 2 \sqrt{2} 2 .

试题识别正确,思维链无效,答题错误,得 0 分

  1. 若曲线在点 ( 0 , 1 ) (0,1) (0,1) 处的切线也是曲线 y = ln ⁡ ( x + 1 ) + a y = \ln(x+1) + a y=ln(x+1)+a 的切线,则 a = a = a=

解答:

  • y = ln ⁡ ( x + 1 ) + a y = \ln(x+1) + a y=ln(x+1)+a ( 0 , 1 ) (0,1) (0,1) 处的切线斜率为 1
  • 切线方程为 y = x + 1 y = x + 1 y=x+1
  • 将点 ( 0 , 1 ) (0,1) (0,1) 代入得出 a = 0 a = 0 a=0

最终答案是:0.

试题识别错误,思维链无效,答题错误,得 0 分

  1. 甲乙两人各有四张卡片,每张卡片上标有一个数字,假设甲的卡片上分别有数字 1 , 3 , 5 , 7 1, 3, 5, 7 1,3,5,7,乙的卡片上分别有数字 2 , 4 , 6 , 8 2, 4, 6, 8 2,4,6,8。两人进行四轮比赛,在每轮比赛中,两人各自从自己已有的卡片中随机抽选一张,并比较所选卡片上的数字大小,数字大的人的得 9 分,然后各自再把轮所抽的卡片(弃置的卡片在后面的轮次中不能使用),则甲的比数高于乙的总得分不少于 2 的概率是:

解答:

  • 计算甲乙之间每一轮的胜率
  • 根据独立事件概率相乘原则,计算四轮中甲胜至少 3 次的概率

最终答案是: 1 2 \frac{1}{2} 21(需详细计算验证).

试题识别错误,思维链无效,答题正确,得 5 分

3. 结论

试卷识别正确率思维链有效率得分(满分58)
7/14 = 50%6/14 = 42.9%36

由此可见当前顶级 LLM(大语言模型):

(1)对于高年级数学选择/填空题的解答能力达到及格偏上水平,依然还很大的提升空间;

(2)对于图片识别能力已经达到了较高的水平,图片中包含许多不常见的数学公式;即使对于识别错误的试题,也只是存在少量的错误;

(3)对于数学的解题思考能力依然有待提升,超过半数试题无法提供清晰有效的解题思路。


欢迎关注本人,我是喜欢搞事的程序猿; 一起进步,一起学习;

欢迎关注知乎/CSDN:SmallerFL

也欢迎关注我的wx公众号(精选高质量文章):一个比特定乾坤

;