Openai API Python - 搜索 News

49 分钟

SWE-AGI基准评测：中大型软件在全新语言上的批量生成成功率已达80%

在这一高难度的“系统构建”场景下，模型表现呈现出了明显的两极分化。GPT-5.3-codex 凭借 86.4% 的通过率（19/22）稳居榜首，Claude Opus 4.6 以 68.2%（15/22）紧随其后。相比之下，其他参评模型（包括开源模型及部分闭源模型）在简单任务上的表现尚可，但一旦进入中高难度领域，成功率便跌至个位数甚至为零。

47 分钟

英伟达680亿营收创纪录，黄仁勋称“计算模式已改变”

多年来，英伟达凭借图形处理器（GPU）在人工智能模型训练市场占据绝对主导地位。图形处理器是性能强劲的芯片，可同时完成数十亿次简单运算。随着越来越多科技企业将人工智能工具落地商用，市场需求预计将从模型训练转向推理环节，而推理环节对中央处理器（CPU）的依赖度更高 —— 这类数据中心芯片结构更简单，有更多企业具备设计能力。

49 分钟

SWE-AGI基准测试：AI编程的未来与新语言MoonBit的崛起

MoonBit作为一门相对年轻的语言，尚未形成庞大的开源生态，因此在大型语言模型的预训练语料库中几乎不存在。这一特性有效切断了AI通过记忆复现来蒙混过关的可能性，迫使其必须真正理解RFC规范和API脚手架，从而进行逻辑推演。此外，MoonBit原生支持‘声明先行’的工作流，配合其统一的工具链，为AI提供了极低延迟的编译-测试反馈循环。

凤凰热榜

Gemini 3.1 Pro 曝光，能力翻倍价格不变，谷歌想重新定义 AI 竞争规则

马年「AI 春运」赛程过半，OpenAI、Anthropic、阿里等玩家相继拿出新活儿，现在，Google 也正式加入！当地时间 2 月 19 日，Google 曝光 Gemini 3.1 Pro 最新模型。这一次，Google 没有玩什么花哨的概念，直接用数据说话。在 ARC-AGI-2 这个公认的推理基准测试中， Gemini 3.1 Pro 拿到了 77.1% 的分数。什么概念？它的 ...

4 小时

传苹果接受三星半导体部门100%涨幅报价

英伟达CEO黄仁勋在接受外媒采访时表示，市场误判了AI对软件公司的威胁。他重申了自己的观点，即AI助手不会取代这些软件工具，而是会反过来使用它们，虽然这听起来“有悖常理”，大批软件公司将使用AI助手来开发软件并提高效率。

7 天on MSN

谷歌Gemini 3.1 Pro登场：推理能力跃升，价格持平，AI竞争新局开启

在人工智能领域的激烈角逐中，谷歌近日推出Gemini 3.1 Pro模型，以推理能力的大幅跃升和极具竞争力的定价策略，引发行业广泛关注。这款新模型不仅在性能上实现突破性进展，更通过“加量不加价”的商业策略，重新定义了AI市场的竞争规则。

20 小时

再战微软 VS Code，2 年前落败的 Atom 创始人带着全新 IDE 回归，主打 ...

时光流转，两年后的现在，Atom 创始人 Nathan Sobo 在秉持着“世界各地的开发人员都需要更好的代码编辑器”的愿景下，带着一款名为 Zed 的全新代码编辑器回归，主打一个高性能，还内置了对 OpenAI 和 GitHub Copilot ...

腾讯网

Obsidian + Claudian真香警告：AI知识库终极方案

NotebookLM虽然好用，但ChatGPT无法简单调用，因为前者背后是Google，后者背后是OpenAI。它们的决策，符合公司最大利益，但给个人用户带来了不便。

虎嗅网

人工智能，能治工人

知名 AI 编程软件 Windsurf在发布 4个月内用户数破百万、年度经常性收入（ARR）超过1亿美元、企业客户数量超过1000家。Windsurf的团队仅有不到160人，最终以30亿美元的估值卖身OpenAI，这也成为OpenAI史上规模最大的收购 [1] 。

一些您可能无法访问的结果已被隐去。

显示无法访问的结果