以DeepSeek‑R1为例,仅靠强化学习训练,模型在AIME数学推理基准上的pass@1从15.6%提升至 77.9%,充分展示了RL在低数据量条件下即可实现大幅能力跃升,迅速成为后训练赛道的新范式。
科技行者 on MSN
DeepSeek推出V3.2:开源大模型首次挑战GPT-5,在数学竞赛中勇夺金牌
这项由DeepSeek-AI团队发表于2025年12月的重要研究,向我们展示了开源人工智能模型的一个重大突破。有兴趣深入了解的读者可以通过arXiv:2512.02556v1查询完整论文。这个名为DeepSeek-V3.2的新模型不仅在性能上与GPT ...
机器之心发布当 OpenAI 前 CTO Mira Murati 创立的 Thinking Machines Lab (TML) 用 Tinker 创新性的将大模型训练抽象成 forward backward,optimizer step ...
当你听说某个AI模型在数学考试中得了满分时,可能会觉得人工智能的数学能力已经超越人类了。然而真实情况远比这复杂。最近这项来自腾讯和中国人民大学的研究揭示了一个令人深思的现象:当我们用真正的前沿数学研究来测试这些AI时,即便是最先进的模型也会暴露出巨大的能力短板。 研究团队开发了一个名为EternalMath的测试系统,它的特别之处在于能够自动从最新发表的数学论文中提取问题。这就好比给AI出题的老师 ...
在大公司一路高歌猛进的 AI 浪潮里,小创业者和高校研究者正变得越来越迷茫。就连前段时间谷歌创始人谢尔盖・布林回斯坦福,都要回答「大学该何去何从」「从学术到产业的传统路径是否依然重要」这类问题。 AI,真的只是大公司的游戏吗?被算力掣肘的其他研究者、创业者,机会在哪里?在「强化学习」后训练引领「下半场」的当下,这个问题变得愈发重要。 好在,国内外都有专业团队在关心这个问题,比如前 OpenAI C ...
小黑盒数码硬件 on MSN
无需Docker! NAS一键部署可视化AI绘图神器,功能太懂人心
【本文由小黑盒作者@噩梦飘雷于01月06日发布,转载请标明出处!】 大家好,我是飘雷。 最近一直想体验体验Nano Banana Pro,恰巧在网上刷到了网友推荐的一个用于AI绘图的GitHub开源项目Gemini 3 Pro Image ...
在 OpenAI 经历了 Sam Altman 被解雇又回归的内部动荡后,Mira 选择离开,并迅速组建了一支 “梦之队”—— 核心成员包括 OpenAI 前研究副总裁 John Schulman、Lilian Weng ...
腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 倍以上,同时保持甚至提升生成质量。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果