科技中国

AI
业界 手机 电脑 数码 智车 AI 苹果 直播
当前位置: 首页 > AI > 正文

月之暗面发布 k0-math 数学推理模型,能力对标 OpenAI o1

2024-11-16 21:32:59 来源:IT之家 A+A-

11 月 16 日消息,综合第一财经,新浪科技消息,月之暗面旗下 Kimi 今日发布了新一代数学推理模型 k0-math。基准测试显示,Kimi k0-math 数学能力可对标 OpenAI o1 系列可公开使用的两个模型:o1-mini 和 o1-preview

月之暗面创始人杨植麟认为,最适合让 AI 去锻炼思考能力的场景就是数学场景。获悉,在中考、高考、考研以及包含入门竞赛题的 MATH 等 4 个数学基准测试中,k0-math 初代模型成绩超过 o1-mini 和 o1-preview。在两个难度更大的竞赛级别的数学题库 OMNI-MATH 和 AIME 基准测试中,k0-math 初代模型的表现分别达到了 o1-mini 最高成绩的 90% 和 83%

杨植麟表示,k0-math 模型和更强大的 Kimi 探索版,未来几周将会分批在 Kimi 网页版和 Kimi 智能助手 App 端陆续上线。

Tags:OpenAI
(责任编辑:Diy92)

推荐阅读 相关文章

豆包上线视频通话功能:支持实时问答互动,具备视觉理解能力

5月23日消息,从豆包公众号获悉,豆包今日宣布在 App 端上线实时视频通话功能,用户在“...[详细]

2025-05-25 10:51:15

今年前4月我国智能家居类消费品新增3万种,同比增长1985.5%

5月23日消息,市场监管总局今日发布统计数据,今年1—4月,我国消费品新增809.8万种,同比...[详细]

2025-05-25 10:51:15

联想展出国内首个轮胎 AI 质检智能体方案,效率较人工提升1.5倍

5月23日消息,据联想官方今日消息,在上周的2025中国国际橡胶轮胎暨汽车配件展览会上,...[详细]

2025-05-25 10:51:15

京东内部的智能体数量已超1.4万个,JoyAgent2.0发布

5月23日消息,京东云城市大会于5月20日在上海举行,京东云发布 JoyAgent 智能体2.0。...[详细]

2025-05-25 10:51:15

0.103秒!全球最快魔方机器人问世,解魔方比眨眼还快

5月23日消息,科技媒体 scitechdaily 昨日发布博文,报道称来自普渡大学的工程团队研...[详细]

2025-05-25 10:51:15

苹果传奇设计师艾维财富被曝光:因 OpenAI 收购获利7.15亿美元

北京时间5月26日,据《福布斯》报道,iPhone 设计大师乔纳森・艾维 即将登上《福布斯...[详细]

2025-05-27 07:31:49

AI 模型4o → o3:OpenAI 升级 Operator 智能体,浏览器交互更稳定、更准确

5月24日消息,科技媒体 bleepingcomputer 今天发布博文,报道称 OpenAI 升级 Operator...[详细]

2025-05-25 10:51:15

OpenAI新模型GPT-4.1 可靠性遭质疑:独立测试显示其对齐性下降明显

4 月 24 日消息,本月早些时候 OpenAI 推出了 GPT-4.1 人工智能模型,并声称该模型在遵循指令方面表现出色。然...[详细]

2025-04-24 09:47:12

OpenAI将ChatGPT 新图像生成技术引入API,每张图支付费用2美分起

4 月 24 日消息,OpenAI 于本周三宣布,将其 ChatGPT 中新升级的图像生成功能背后的技术引入 API,使开发者能够将...[详细]

2025-04-24 09:47:12

据称 OpenAI 计划今年夏初发布开源语言模型,力争推理能力超越同类AI

4 月 24 日消息,今年 3 月底,OpenAI 宣布计划在今年某个时候发布自 GPT-2 以来的首个"开源"语言模型,目前该模...[详细]

2025-04-24 09:47:12

联系方式