LLMs是否真正遵循了“惨痛教训” (The Bitter Lesson) 的原则,从而能够实现其被大肆宣传的巨大潜力?图灵奖得主,强化学习之父 Richard Sutton认为答案是否定的。他主张,LLMs 过度依赖于模仿和提炼有限的人类知识(例如整个互联网的文本数据),并且需要大量的 ...
昨天3月5日,全球最大的计算机专业人士协会(ACM)刚刚宣布将2024年图灵奖授予Richard Sutton(理查德·萨顿)和Andrew Barto(安德鲁·巴托)。在这一重大消息公布之后,Sutton教授接受了一场独家专访。" 强化学习的核心是从经验中学习,"Sutton教授在这场专访中解释道。
计算机学界的最高荣誉“图灵奖”(A.M. Turing Award)今年颁给强化学习(Reinforcement Learning)奠基者Andrew Barto和Richard Sutton(首图右),表彰他们开创性的研究,为人工智能铺路。两位研究者将共享Google资助的100万美元奖金。 从神经科学启发到AI基石 1977年Andrew Barto ...