麻豆一区新品特选蜜桃，品质精良，甜蜜满溢——品牌故事展播

慧眼编者发布时间：2025-06-12 06:05:30

摘要： 麻豆一区新品特选蜜桃，品质精良，甜蜜满溢——品牌故事展播让人思索的决策，难道这正是未来的方向？，震撼人心的事件，难道我们还不应该关注吗？

麻豆一区新品特选蜜桃，品质精良，甜蜜满溢——品牌故事展播让人思索的决策，难道这正是未来的方向？，震撼人心的事件，难道我们还不应该关注吗？

"麻豆一区全新新品特选蜜桃，以其卓越的品质与甜美滋味，引人瞩目的品牌形象深入人心。此款蜜桃精选优质果肉，精心烘焙而成，每一口都仿佛是大自然馈赠的甜蜜魔法。其色泽鲜艳、口感细腻，咬下去满溢的甜蜜更是让人回味无穷。品牌以独特的人文关怀和匠心独运的工艺设计，将现代科技与传统工艺相结合，打造出一款集艺术美感与实用价值于一体的美食佳品。麻豆一区蜜桃，传承百年经典，引领时尚潮流，甜而不腻，展现着中国食品的独特魅力和精致品味，为每一位热爱生活的你，带来无尽的美好享受。"

机器之心报道

编辑：杨文、+0

话接上回。高考数学一结束，我们连夜使用六款大模型产品，按照一般用户截图提问的方式，挑战了 14 道最新高考客观题，不过有网友质疑测评过程不够严谨，所以这次我们加上解答题，重新测一遍。

本次参加挑战的选手分别是：Doubao-1.5-thinking-vision-pro、DeepSeek R1、Qwen3-235b、hunyuan-t1-latest、文心 X1 Turbo、o3，并且新增网友们非常期待的 Gemini 2.5 pro。上一次我们使用网页端测试，这次除 o3 外，其他模型全部调用 API。

在考题选择上，我们仍然采用 2025 年数学新课标 Ⅰ 卷，包含 14 道客观题，总计 73 分；5 道解答题，总计 77 分。其中第 6 题由于涉及到图片，我们就单独摘出来，后面通过上传题目截图的形式针对多模态大模型进行评测。其他文本题目全部转成 latex 格式，分别投喂给大模型，还是老规矩，不做 System Prompt 引导，不开启联网搜索，直接输出结果。

（注：第 17 题虽然也涉及到图片，但文字表述足够清晰，不影响答题，因此也以 latex 格式测评。）

客观题计分方法按照以往高考判分原则：

至于解答题，由于现在还未出具体的评分细则，所以我们请数学专业的朋友进行评判，主要还是看大模型的最终答案以及解题步骤中是否有严重失误点。

7 家大模型考试成绩如下图所示。

从客观题来看，各家大模型几乎拉不开差距，最大分差也只有 3 分，第 6 题图像题更是让这几家多模态大模型「全军覆没」。在上一次测评中，o3 客观题成绩垫底，但有网友表示，这可能是由于某些原因导致后台自动切换成其他模型，而这一次我们选用的是未「降智」的 o3，选择题和填空题成绩仍是排在最后，当然，65 分的成绩相比「降智」版确实有很大提升。

文章版权及转载声明：

作者: 慧眼编者本文地址： https://m.dc5y.com/news/edlx1no8xnqhpn.html 发布于（2025-06-12 06:05:30）
文章转载或复制请以超链接形式并注明出处央勒网络

相关文章