本次测试了当前评价最高的三款大模型doubao1.5、gpt-o1、deepseek-v3(r1崩溃),都是采用无提示词的硬核提问方式,测试视频如下。
gpto1、doubao1.5、deepseek测评
测试方式:
上传美赛六道题目文件
直接提问以下5句话:
-
这是一道数学建模题目,请做下问题重述
-
请给出每一个问题的思路
-
针对每个问题推荐前沿算法
-
建立第一问数学模型
-
编写第一问数学模型的程序
本次测试了当前评价最高的三款大模型doubao1.5、gpt-o1、deepseek-v3(r1崩溃),都是采用无提示词的硬核提问方式,测试视频如下。
gpto1、doubao1.5、deepseek测评
测试方式:
上传美赛六道题目文件
直接提问以下5句话:
这是一道数学建模题目,请做下问题重述
请给出每一个问题的思路
针对每个问题推荐前沿算法
建立第一问数学模型
编写第一问数学模型的程序
道可道,非常道;名可名,非常名。 无名,天地之始,有名,万物之母。 故常无欲,以观其妙,常有欲,以观其徼。 此两者,同出而异名,同谓之玄,玄之又玄,众妙之门。