CUDA Version GPU - 搜索 News

CUDA重大更新：原生Python可直接编写高性能GPU程序

NVIDIA 在2025年GTC大会上宣布了一项具有里程碑意义的技术更新：CUDA并行计算平台正式支持原生Python编程。这一突破性进展将 ...

DeepSeek绕过CUDA！为适配中国国产GPU做准备

2月5日消息，DeepSeek全球爆火，再一次引发外界对GPU算力限制话题的关注。据报道，DeepSeek开发的大语言模型绕过了英伟达的CUDA框架，正为未来兼容国产GPU芯片做准备。众所周知，英伟达的CUDA（Compute Unified Device Architecture，统一运算架构）能大幅降低研发大模型 ...

电子工程专辑

DeepSeek积极筹备适配国产GPU，绕开英伟达CUDA

DeepSeek自上线以来便以迅猛的速度在全球范围内获得了广泛关注，其日活用户数在短时间内突破2000万，成为全球增速最快的AI应用之一。作为一家中国人工智能初创企业，外部算力（主要是GPU）限制逐渐成为制约其进一步发展的瓶颈，如今他们正致力于通过优化 ...

新浪网

CUDA是英伟达的壁垒，却是其他GPU厂商的泥潭

A科技公司，曾是国产化的急先锋。它们的目标明确：摆脱对英伟达的依赖，打造完全自主的技术体系。他们相信，随着国产GPU的崛起，自己能够在国际舞台上拥有一席之地。于是，一场雄心勃勃的计划展开了：全面替换现有的英伟达 GPU，转向国产GPU。一切看 ...

电子工程专辑

LM Studio 借助 NVIDIA GeForce RTX GPU 和 CUDA 12.8 加速 LLM 性能

随着 AI 使用场景不断扩展（从文档摘要到定制化软件代理），开发者和技术爱好者正在寻求以更快、更灵活的方式来运行大语言模型（LLM）。在配备 NVIDIA GeForce RTX GPU 的 PC 上本地运行模型，可实现高性能推理、增强型数据隐私保护，以及对 AI 部署与集成的 ...

36氪

英伟达自毁CUDA门槛，15行Python写GPU内核，性能匹敌200行C++

英伟达发布最新版CUDA 13.1，官方直接定性：这是自2006年诞生以来最大的进步。核心变化是推出全新的CUDA Tile编程模型，让开发者可以用Python写GPU内核，15行代码就能达到200行CUDA C++代码的性能。英伟达是不是亲手终结了CUDA的“护城河”？如果英伟达也转向Tile ...

中关村在线

DeepSeek准备适配国产GPU，绕开英伟达CUDA

DeepSeek要适配国产GPU了？这确实是大好事一件。据报道，DeepSeek在研发大模型时绕过了英伟达的护城河CUDA，这意味着可以直接根据GPU的驱动函数做一些新的开发，从而实现更加细粒度的操作。例如DeepSeek在多节点通信时绕过了 CUDA 直接使用 PTX（Parallel Thread Execution ...

快科技

曝DeepSeek绕过CUDA！为适配中国国产GPU做准备跳出英伟达限制

快科技2月5日消息，DeepSeek全球爆火，再一次引发外界对GPU算力限制话题的关注。据报道，DeepSeek开发的大语言模型绕过了英伟达的CUDA框架，正为未来兼容国产GPU芯片做准备。众所周知，英伟达的CUDA（Compute Unified Device Architecture，统一运算架构）能大幅降低研发 ...

一些您可能无法访问的结果已被隐去。

显示无法访问的结果