1.多非共识,Test-time Scaling 能否一直大力出奇迹? Test-time Scaling 有哪些非共识?流行的 Sequential 和 Parallel 路线有何局限?Test-time Scaling 为何需要「Better Search」?「温度」如何影响 Scaling 效果?Test-time Scaling 有哪些「Where」需要改进?... 2. Skills ...
1. 用 Test Time 换 Training Time 能让 LLM 更强吗? Self-Play 会是训 LLM 的新热点吗?把预算投入 Inference 会比扩大 LLM 参数更有效吗?PRM 对 Test-Time Compute 性价比影响多大?额外的 Inference Time 能帮 LLM 提升多少能力?Test-Time Compute 性价比还能再提高吗?... 2.
本文由来自香港城市大学、麦吉尔大学(McGill)、蒙特利尔人工智能实验室(MILA)、人大高瓴人工智能学院、Salesforce AI Research、斯坦福大学、UCSB、香港中文大学等机构的多位研究者共同完成。第一作者为来自香港城市大学的博士生张启源和来自蒙特利尔人工 ...
2025年3月,兰德公司(RAND)发布《当人工智能需要时间思考时:浅谈“测试时计算”的含义》(When AI Takes Time to Think: Implications of Test-Time Compute),文章介绍了“测试时计算”(Test-Time Compute,TTC)在推理型人工智能模型中的兴起及其深远影响。启元洞见编译文章 ...
齐鲁网·闪电新闻3月2日讯 近日,山东工商学院信息与电子工程学院郭文教授的论文"Dual-level Adaptation for Multi-Object Tracking: Building Test-Time Calibration from Experience and Intuition"被IEEE/CVF Conference on Computer Vision and Patter ...
21 天on MSN
VISCALE 2026:探索视觉推理新范式,共赴计算扩展新征程
计算机视觉领域正迎来一场由推理扩展技术驱动的范式变革。随着大语言模型通过测试时计算扩展(Test-time Scaling)在逻辑推理层面实现突破,视觉智能的研究重心正从静态像素分析转向动态世界建模。这种转变标志着视觉系统从"被动感知"向"主动认知"的跨越,为构建具备人类级空间理解能力的AI模型开辟了新路径。
一些您可能无法访问的结果已被隐去。
显示无法访问的结果