最近几个月,大语言模型(LLM)领域出现了一个有趣的现象:虽然开源社区依然活跃,但闭源模型(如GPT 5系列、Claude 4.5、Gemini 3.0)似乎正在加速拉开差距。可能是西方马上圣诞节的缘故,各家的狠活都一个接一个地来了。这种差距不仅仅体现在跑分上,更体现 ...
【TechWeb】12月2日消息,昨日晚间,DeepSeek发布了两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale,并开源。DeepSeek-V3.2 达到了 GPT-5 的水平,DeepSeek-V3.2-Speciale在主流推理基准测试上的性能表现媲美 Gemini-3.0-Pro。 在发布的技术论文中,DeepSeek团队提到,过去几个月中出现 ...
IT之家 12 月 1 日消息,DeepSeek V3.2 正式版今日发布,强化 Agent 能力,融入思考推理。 官方今日同时发布两个正式版模型:DeepSeek-V3.2 和 DeepSeek-V3.2-Speciale。 官方网页端、App 和 API 均已更新为正式版 DeepSeek-V3.2。Speciale 版本目前仅以临时 API 服务形式开放,以供社区 ...
IT之家 9 月 29 日消息,今晚,DeepSeek-V3.2-Exp 发布并开源,引入稀疏 Attention 架构。华为宣布昇腾已快速基于 vLLM/SGLang 等推理框架完成适配部署,实现 DeepSeek-V3.2-Exp 0day 支持,并面向开发者开源所有推理代码和算子实现。 IT之家从官方介绍获悉,昇腾在 DeepSeek-V3.2 ...
离春节不到一周,过去两年的经验告诉我们,国产AI新产品的爆发期又要来了。 Kimi K2.5在OpenRouter上一骑绝尘,Minimax也在官网上隐隐约约透露出M2.2的版本代号。 大家等得很焦急,智谱和DeepSeek年前是不是也得来点大动作? 这不,短短48小时内,三个独立的技术平台接连出现了与智谱新模型GLM-5相关的线索,形成了一条完整的信息链。 01 线索浮现:三平台齐曝 GLM-5 ...
前者聚焦平衡实用,适用于日常问答、通用Agent任务、真实应用场景下的工具调用。 推理达GPT-5水平,略低于Gemini-3.0-Pro。 后者主打极致推理,推理基准性能媲美Gemini-3.0-Pro。 还一把斩获IMO 2025、CMO 2025、ICPC World Finals 2025、IOI 2025金牌。 划重点,ICPC达到人类选手 ...
IT之家2 月 11 日消息,华为云“码道”(CodeArts)代码智能体在马年春节前开启万人公测。 目前,“码道”个人版已面向开发者免费开放,企业版后续公布。该产品接入 GLM-4.7 和 DeepSeek-V3.2 模型,支持 JetBrains 系列、 Visual Studio Code 两大 IDE。 据官方介绍,“码道”是华为云打造的智能编码产品,深度融合 IDE、自主开发模式与代码大 ...
DeepSeek想让开源模型重回第一梯队。 DeepSeek想让开源模型重回第一梯队。 智东西12月2日报道,昨晚,DeepSeek发布了两款新模型:DeepSeek-V3.2和DeepSeek-V3.2-Speciale。这是DeepSeek当前性能最强大的模型,在推理、智能体等多领域基准测试中斩获全球开源模型第一的表现。
9月29日晚间,国产人工智能(AI)技术厂商深度求索(DeepSeek)宣布正式发布DeepSeek-V3.2-Exp模型,正如其名称所示的那样,这是一个基于V3.2实验性(Experimental)的版本。 作为迈向新一代架构的中间步骤,Deepseek V3.2-Exp 在 V3.1-Terminus 的基础上引入了 DeepSeek Sparse ...
通信世界网消息(CWW)两个月前,我们发布了实验性的 DeepSeek-V3.2-Exp,并收到了众多热心用户反馈的对比测试结果。目前未发现 V3.2-Exp 在任何特定场景中显著差于 V3.1-Terminus,这验证了 DSA 稀疏注意力机制的有效性。也感谢广大用户一直以来的积极反馈与支持 ...
2. 更高的思考效率:相比DeepSeek-R1-0528,DeepSeek-V3.1-Think能在更短时间内给出答案; 3. 更强的Agent能力:通过Post-Training优化,新模型在工具使用与智能体任务中的表现有较大提升。 而在官方推文中,特别强调了DeepSeek-V3.1使用了UE8M0 FP8 Scale的参数精度。并且在其 ...