Bootstrap

数模测评:doubao1.5>deepseek-v3>gpt-o1

本次测试了当前评价最高的三款大模型doubao1.5、gpt-o1、deepseek-v3(r1崩溃),都是采用无提示词的硬核提问方式,测试视频如下。

gpto1、doubao1.5、deepseek测评

测试方式:

上传美赛六道题目文件

图片

直接提问以下5句话:

  • 这是一道数学建模题目,请做下问题重述

  • 请给出每一个问题的思路

  • 针对每个问题推荐前沿算法

  • 建立第一问数学模型

  • 编写第一问数学模型的程序

;