安爸-超级家庭

时隔一年,再次使用7个国产AI大模型写高考作文,国产模型的进步也太大了!有彩蛋。

安爸 发布于

开头当然要先预祝莘莘学子高考必胜!

每年的高考作文都是备受关注的焦点。

去年的6月7号,写了同样的一篇文章来评测国产模型写高考作文的能力,当时各家模型都或多或少的出现了一些问题。

“首先,其次,再次,此外”诸如此类的词汇实在是太多,导致读起来有流水账的感觉,KIMI甚至连字数都没写够。

然而今年,国产AI模型真的崛起了, 能力有了指数级提升,文采好得惊人。作为人类,也是曾经的高考考生,自愧不如。

今年选择了7个国产模型来参加高考语文作文测试,用DeepSeek来打分。(如有thinking模式都会打开)

每家模型只有一次机会,跟高考一样,今年考不好就得复读一年明年再战了。

参赛选手:KIMI、豆包、腾讯元宝、通义千问、文心一言、讯飞星火、DeepSeek

阅卷评委:DeepSeek

PS:DeepSeek的文采实在是太好了,只好让它来自己给自己评分了。

文末有彩蛋哦\~

评分

Kimi去年没写够字数,今年真是发了力,写了1700多字,作文纸上能写开吗?

DeepSeek跟通义千问居然没有写够字数,但是文笔依然是很不错。

但是要说扣题,还是通义千问和文心一言真的牛。

下面这是去年的评分表,可以看到各考试都有了明显的进步。

去年出现的问题也比较少了。

下面是去年AI模型写的文章,帮大家回顾下,就知道今年国产AI模型的进步有多大了。

2025年内容PK

豆包

讯飞星火

通义千问

Kimi

DeepSeek

文心一言

腾讯元宝

彩蛋

海外模型在国内真的有很多场景水土不服,拿0分真的也是正常了。

Grok绞尽脑汁审题,思考了606秒!

结果写的文章标题艺术的力量,这不是妥妥的跑题了吗。

Gemini也是,直接写了篇万字长文,真是惊呆我。

总结

历时一年,国产模型真的大转变,那股子浓浓的AI味儿没了。

文采的提升,真的不只是一点点,是质的飞跃。

写文章的能力,现在各家都差不多了,在数学推理上,可能差距还是会比较大的。

等过几天数学考试的时候,肯定比拼更加精彩,咱们拭目以待。

记得点个关注哦\~\~咱们下期内容见\~\~

扫码加入AI交流群

获得更多技术支持和交流

(请注明自己的职业)

关注「开源AI项目落地」公众号

(文:开源AI项目落地)

时隔一年,再次使用7个国产AI大模型写高考作文,国产模型的进步也太大了!有彩蛋。最先出现在每时AI


扫描二维码,在手机上阅读