Deepseek Coding - 搜索 News

3 小时

DeepSeek深夜发论文，V4前奏来了？联手清北破GPU难题，智能体大爆炸

在目前流行的预填充-解码分离系统中，命中token的KV缓存完全由预填充引擎直接从远程存储加载。这种设计将所有存储I/O压力集中在预填充端的网卡上，而解码引擎端的网卡则基本处于空闲状态。

DeepSeek V4 压顶，Anthropic CEO 先动手了：一场漏洞百出的舆论战，从 ...

整理 | 褚杏娟这段时间，华尔街造了“新神”Anthropic。过去一个月里，多次板块级波动都被市场解读为与 Anthropic 的产品发布直接相关：周一 IBM 股价大跌，有交易员将导火索归因于 Anthropic 宣传的一款工具，它可能自动化 ...

腾讯网

手把手：1分钟把 Claude Code 迁到 DeepSeek V3.1，开箱即干

今天下午，DeepSeek 官方正式发布 DeepSeek-V3.1。相比于前天只在用户群里通知，今天新增了模型升级点、榜单成绩、model card，huggingface 上现在也可以下载模型文件了。一共两个模型，分别是 V3.1 和 V3.1 base。两个模型结构完全一致，V3.1 的 Base 模型在 V3 的基础上 ...

腾讯网

实测DeepSeek vs GLM-5，中国AI杀疯了，程序员危！！

同时，它还给了2种最佳操作方案。如果店里是人工精洗，那就把钥匙给店员，自己回家休息。如果是机洗，建议洗完再兜个圈，让车身上的风把水吹干。

5 小时

DeepSeek联合清北发布DualPath推理框架：吞吐量提升近2倍

数据显示，研究团队在包含1152个GPU的大规模生产集群上，使用660B规模的模型进行了实测。结果表明，DualPath在离线推理场景下的吞吐量提高了1.87倍，在线服务场景下的吞吐量平均提升了1.96倍。此外，在高负载环境下，首字延迟（TTFT）得到大幅优化，而Token间的生成速度几乎未受干扰。（袁宁） ...

腾讯网

超越Deepseek，Claude Code 2.0和这个国产模型才是最强编程组合

最近的 AI 编程圈，实在是太卷了。感觉我就是睡了一觉，起来天就变了：前脚Anthropic刚把Claude Code 升级到 2.0、发布Claude sonnet 4.5，后脚 DeepSeek 就密集更新到了 v3.2-exp。还没等我缓过神，昨晚刷 X，智谱的 GLM-4.6 已经悄悄干到了开源第一，把 DeepSeek 给超了。

1 天

DeepSeek、月之暗面、MiniMax被点“非法提取”，它们做错了吗? | 电厂

当地时间2月23日，美国大模型公司Anthropic发布官方声明，称旗下大模型Claude遭到了中国模型企业DeepSeek（深度求索）、Moonshot（月之暗面）、MiniMax（稀宇科技）的“非法提取（illicitly extract）”。

快科技

AMD显卡可以本地玩DeepSeek了！附简单部署教程

快科技2月9日消息，DeepSeek火得一塌糊涂，国内外的相关企业都在积极适配支持，而对于AI大模型来说，使用GPU运行无疑是最高效的，比如AMD，无论是Instinct加速卡还是Radeon游戏卡，都已经适配到位。你只需要任意一块AMD RX 7000系列显卡，就可以在本地体验DeepSeek。

14 天

智谱与Minimax交出“大招”之后，DeepSeek“平A”了一下

谁能想到，仅仅一个晚上，国内三大AI巨头接连发布了自己的新模型？ DeepSeek、智谱和MiniMax无缝衔接上演了这出好戏，AI爱好者们在这个春节可是有的忙了。在算力紧缺、同质化加剧的当下，国产大模型逐渐走上差异化的路径：有人押注超长文本的记忆边界，有人攻坚智能体的工程化落地，也有人选择以轻量和效率闯进企业级市场。 01 DeepSeek：百万级上下文定义长文本处理边界首先是产品端沉寂已 ...

Opinion

OFweekOpinion

显示无法访问的结果