2026 年 4 月,AI 行业进入 “逻辑深耕” 的高质量发展阶段,逻辑拆解与数理推理能力成为衡量大模型核心价值的关键指标。据 CSDN4 月 27 日最新发布的《2026 年 AI 圈最前沿全景报告》显示,当前 AI ...
张良介绍道,这次解耦工作量很大,接近于“把软件重写一遍、把架构重新设计一遍”。昇腾原计划用一年半时间完成,但最终在 4 个月内完成核心改造。近期开发者试用后,普遍认为相比过去更容易上手。
2026 年 4 月,全球 AI 算力竞争进入白热化阶段,架构革新与成本优化成为行业核心命题。4 月 23 日,工信部发布《人工智能 + ...
导读:本文介绍DeepSeek V4 如何激发最大思考能力,V4这个模型优势和擅长的领域,以及一些个人深度使用的感受。DeepSeek我写过很多次,他们实事求是的做事风格,到极客的开源精神都很对我胃口。在这个各家动不动就 “震惊” ...
DeepSeek 用万亿参数级别的模型验证了昇腾可以承载顶级大模型的推理,这对整个国产算力生态是一针强心剂。国内大厂本就在加大昇腾芯片的采购力度,V4 的成功适配让这个决策有了更充分的技术背书。寒武纪、海光信息等其他国产芯片厂商也会被倒逼着加速自己的大模型适配进度。
芯东西4月24日报道,刚刚,华为昇腾直播解读DeepSeek-V4技术,并披露昇腾950性能表现。截至发稿,华为昇腾、寒武纪、海光信息、摩尔线程、沐曦股份、百度昆仑芯、阿里平头哥真武、天数智芯8家国产AI芯片品牌和英伟达均已适配DeepSeek-V4 ...
面试造火箭的基础,包含 Transformer 变体与底层数学原理。 从“鹦鹉学舌”到“自主智能”,涵盖最新的 MCP 协议与检索增强。 如何低成本训练大模型?SFT 细节与灾难性遗忘解决方案。 DeepSeek-R1 引爆的核心板块,从 PPO 到 GRPO 的演进。 不读 Paper 怎么过面试?
InfoQ中国 on MSN
小米万亿模型全面开源:MIT 协议、1M 上下文,但还是打不过 DeepSeek
4月28日,小米开源了 MiMo-V2.5 和 MiMo-V2.5-Pro 两款模型:MiMo-V2.5 基础模型提供原生多模态能力,而 MiMo-V2.5-Pro 则是专门为“长周期一致性”和复杂软件工程设计的。 小米采用了宽松、对企业友好的 ...
“时代洪水冲天下,长空激浪正当时。”在日前举办的昇腾生态媒体沟通会上,华为昇腾专家以此作结,系统性地向外界披露了昇腾在生态建设上的最新进展与核心战略。 CANN的底层重构 作为昇腾AI异构计算架构,CANN是连接硬件与上层应用的核心纽带,其性能与易用性直接决定昇腾生态的竞争力。 目前,行业可以仿照CUDA走一条“捷径”,但昇腾坚持从底层指令集、编译器到运行时全栈自研。 “我们把这一套原来像麻花团一 ...
AI 智能答题助手 (AI Study Copilot) 是一款面向在线学习、职业考证与考前练习的浏览器扩展,基于 DeepSeek V3.2 大模型构建。 不同于静态题库检索,本插件通过实时 AI 上下文分析与深度数据捕获,可处理变种题、阅读理解与复杂跨学科题目,帮助用户高效检索与解析 ...
Tenstorrent正式推出Galaxy Blackhole AI计算平台。每套6U系统搭载32块Blackhole加速芯片,通过100 Tbps以太网互联,提供1TB GDDR6显存、16 TB/s内存带宽及23 petaFLOPS FP8算力,售价11万美元,仅为英伟达同类产品的五分之一。四节点超级集群售价44万美元,最多可扩展至32节点、逾千块芯片。官方称其在DeepSeek V3测试中可 ...
一些您可能无法访问的结果已被隐去。
显示无法访问的结果