AlphaGo之父对话“连线”,曾被导师劝阻研究强化学习,如今获得ACM计算奖

  • 栏目:bbin网页版试玩入口 时间:2020-12-29 11:23 分享新闻到:
<返回列表

本周,DeepMind的MuZero通过了同行评审,发表在了最新一期的Nature杂志上。

MuZero是一个通用的游戏AI,它在围棋、象棋、将棋和57款Atari游戏上都超过了人类的表现。而且这个AI事先不需要事先知道规则。

近日,DeepMind的首席科学家、AlphaGo首席研究员David Silver接受了《连线》杂志的采访,讨论了MuZero、强化学习以及对未来通用人工智能的看法。

David Silver毕业于剑桥大学,在那里与DeepMind创始人Demis Hassabis成为朋友。

Silver曾领导DeepMind的强化学习研究小组,由于在计算机游戏领域的突破性进展,他获得了2019年ACM计算奖。

为何MuZero很重要

连线:MuZero发表在Nature杂志上。对于不了解此事人,告诉我们为什么它很重要。

David Silver:MuZero向前迈出的重要一步是,我们没有告诉它环境的动态。它必须自己想办法,让自己提前计划,想出最有效的策略。

我们希望拥有在现实世界中可以运行的算法,而现实世界却是复杂、混乱且未知的。所以你不能只向前看,就像下棋一样。你必须学会这个世界是如何运转的。

一些观察人士指出,MuZero、AlphaGo和AlphaZero并非真正零开始。它们使用聪明人设计的算法来学习如何执行特定任务。这是不是错过了重点?

分享新闻到:

更多阅读

张业遂:从宪制层面对完善香港特区选举

bbin网页版试玩入口 2021-05-23
新华社北京3月4日电 十三届全国人大四次会议4日晚举行新闻发布会,大会发言人张业遂在...
查看全文

全球疫情动态【3月4日】:国药集团新冠

bbin网页版试玩入口 2021-05-23
财联社(上海,编辑吴斌)讯,美国约翰斯·霍普金斯大学发布的统计数据显示,截至北京时间...
查看全文

皇庭国际(000056.SZ)副董事长邢福俊辞职

bbin网页版试玩入口 2021-04-22
智通财经APP讯,皇庭国际(000056,股吧)(000056.SZ)公告,公司副董事长邢福俊因个人原因辞去公司董...
查看全文


Powered by bbin网页版试玩入口 @2018 html地图

Copyright 站群 © 2013-2021 版权所有