以DeepSeek‑R1为例,仅靠强化学习训练,模型在AIME数学推理基准上的pass@1从15.6%提升至 77.9%,充分展示了RL在低数据量条件下即可实现大幅能力跃升,迅速成为后训练赛道的新范式。
科技行者 on MSN
DeepSeek推出V3.2:开源大模型首次挑战GPT-5,在数学竞赛中勇夺金牌
这项由DeepSeek-AI团队发表于2025年12月的重要研究,向我们展示了开源人工智能模型的一个重大突破。有兴趣深入了解的读者可以通过arXiv:2512.02556v1查询完整论文。这个名为DeepSeek-V3.2的新模型不仅在性能上与GPT ...
机器之心发布当 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab (TML) 用 Tinker 创新性的将大模型训练抽象成 forward backward,optimizer step ...
当你听说某个AI模型在数学考试中得了满分时,可能会觉得人工智能的数学能力已经超越人类了。然而真实情况远比这复杂。最近这项来自腾讯和中国人民大学的研究揭示了一个令人深思的现象:当我们用真正的前沿数学研究来测试这些AI时,即便是最先进的模型也会暴露出巨大的能力短板。 研究团队开发了一个名为EternalMath的测试系统,它的特别之处在于能够自动从最新发表的数学论文中提取问题。这就好比给AI出题的老师 ...
导读:《自然》(Nature)杂志公布年度十大科学人物榜单,深度求索(DeepSeek)创始人梁文锋因在AI透明化研究领域的突破性贡献入选。 12 月 9 日凌晨,国际顶级期刊——英国《自然》(Nature)杂志公布了 2025 年度十大科学人物榜单(Nature’s 10)。DeepSeek 创始人 ...
Nvidia Denies ‘Far-Fetched’ Claims as Chip-Smuggling Allegations Target China’s DeepSeek Your email has been sent Rumors are crackling across the Pacific: China’s DeepSeek is allegedly training its ...
A practical guide to the four strategies of agentic adaptation, from "plug-and-play" components to full model retraining.
顶尖国际模型如GPT、Gemini在专家级数学难题FrontierMath上表现优异,但在真正高难度问题面前仍未满分,显示出推理能力仍有提升空间。与此同时,AI推理能力和强化学习的进步让增长速度几乎翻倍,成本大幅下降,许多模型已能在消费级硬件上运行。
在大公司一路高歌猛进的 AI 浪潮里,小创业者和高校研究者正变得越来越迷茫。就连前段时间谷歌创始人谢尔盖・布林回斯坦福,都要回答「大学该何去何从」「从学术到产业的传统路径是否依然重要」这类问题。 AI,真的只是大公司的游戏吗?被算力掣肘的其他研究者、创业者,机会在哪里?在「强化学习」后训练引领「下半场」的当下,这个问题变得愈发重要。 好在,国内外都有专业团队在关心这个问题,比如前 OpenAI C ...
在 OpenAI 经历了 Sam Altman 被解雇又回归的内部动荡后,Mira 选择离开,并迅速组建了一支 “梦之队”—— 核心成员包括 OpenAI 前研究副总裁 John Schulman、Lilian Weng ...
What our readers found particularly interesting: The Top 10 News of 2025 were dominated by security, open source, TypeScript, ...
Find Musk Xai Latest News, Videos & Pictures on Musk Xai and see latest updates, news, information from NDTV.COM. Explore more on Musk Xai.
一些您可能无法访问的结果已被隐去。
显示无法访问的结果