腾讯微信 AI 团队提出 WeDLM(WeChat Diffusion Language Model),通过在标准因果注意力下实现扩散式解码,在数学推理等任务上实现相比 vLLM 部署的 AR 模型 3 倍以上加速,低熵场景更可达 10 ...
在国际评测和公开对比中,LMArena(Language Model Arena)是业界广泛关注的大模型竞技榜单。2025年12月23日,LMArena发布了最新文本榜单,文心新模型ERNIE-5.0-Preview-1203 以 ‌1451‌ ...
人工智能的快速发展已经彻底改变了我们的生活方式,但许多人对其背后的工作原理仍充满疑问。特别是,AI是如何理解和处理语言的?这篇文章将带你深入探索AI大语言模型的核心构成,从词嵌入到自注意力机制,揭示AI如何通过复杂的数学和算法,实现对人类 ...
NVIDIA发布采用PCIe界面的RTX PRO 5000 72GB Blackwell运算卡,提供更大容量的显示内存,并可升级现有台式机或工作站。 随着大型语言模型(Large Language Model,LLM)的参数量日益庞大,以及代理式AI(Agentic ...