AlphaGo之父对话“连线”,曾被导师劝阻研究强化学习,如今获得ACM计算奖

  • 栏目:bbin网页版试玩入口 时间:2020-12-29 11:23 分享新闻到:
<返回列表

本周,DeepMind的MuZero通过了同行评审,发表在了最新一期的Nature杂志上。

MuZero是一个通用的游戏AI,它在围棋、象棋、将棋和57款Atari游戏上都超过了人类的表现。而且这个AI事先不需要事先知道规则。

近日,DeepMind的首席科学家、AlphaGo首席研究员David Silver接受了《连线》杂志的采访,讨论了MuZero、强化学习以及对未来通用人工智能的看法。

David Silver毕业于剑桥大学,在那里与DeepMind创始人Demis Hassabis成为朋友。

Silver曾领导DeepMind的强化学习研究小组,由于在计算机游戏领域的突破性进展,他获得了2019年ACM计算奖。

为何MuZero很重要

连线:MuZero发表在Nature杂志上。对于不了解此事人,告诉我们为什么它很重要。

David Silver:MuZero向前迈出的重要一步是,我们没有告诉它环境的动态。它必须自己想办法,让自己提前计划,想出最有效的策略。

我们希望拥有在现实世界中可以运行的算法,而现实世界却是复杂、混乱且未知的。所以你不能只向前看,就像下棋一样。你必须学会这个世界是如何运转的。

一些观察人士指出,MuZero、AlphaGo和AlphaZero并非真正零开始。它们使用聪明人设计的算法来学习如何执行特定任务。这是不是错过了重点?

分享新闻到:

更多阅读

投行价值发现能力将更重要

bbin网页版试玩入口 2021-01-14
证券时报记者 谭楚丹 当审批制转向注册制时,券商的承销职能随着发行定价的市场化被大幅强...
查看全文

重整架构储备人才 券商投行赶搭注册制春

bbin网页版试玩入口 2021-01-14
数据来源:Wind 王玉玲/制表 官兵/制图 证券时报记者 谭楚丹 王玉玲 继科创板、创业板试点注...
查看全文

A股“开门红” 逾百股股民收红包

bbin网页版试玩入口 2021-01-13
A股2021年首个交易日喜迎“开门红”。1月4日,A股三大股指集体收涨,其中上证综指站稳3500点...
查看全文


Powered by bbin网页版试玩入口 @2018 html地图

Copyright 站群 © 2013-2021 版权所有