自吸泵厂家
免费服务热线

Free service

hotline

010-00000000
自吸泵厂家
热门搜索:
技术资讯
当前位置:首页 > 技术资讯

谷歌发表Nature封面论文破解围棋难题-【新闻】

发布时间:2021-05-16 15:10:35 阅读: 来源:自吸泵厂家

在迈向搭建具有更类似人类直觉的人工智能道路上,谷歌取得了出乎意料的辉煌一步;他们研发出能够在极其复杂的围棋游戏中击败专家级人类选手的计算机。他们将论文发表在了《Nature》上。

谷歌团队已经表明,掌握围棋所需技能并不为人类独享。他们的一款叫做Alpha Go的计算机程序击败了欧洲围棋冠军Fan Hui,战绩为5:0。Alpha Go的下一个挑战将是世界顶级围棋选手之一,李世乭,比赛将于三月份在首尔举行。开发Alpha Go的团队是Google的DeepMind,这是2014年Google在英国收购的一家很小的人工智能公司。这个团队使用的是一种非常流行和成功的机器学习方法,叫做深度学习,同时还加上了另一种模拟技术来对潜在的步法进行建模。深度学习需要对一个大型的神经网络进行训练,使其对数据中的模式做出反应。事实还证明,它对图像和音频处理也十分有用。许多大型科技公司都在探索新方法来使用这种技术。

要想掌握围棋,需要不断实践练习,也需要识别棋子布局中微妙模式的巧妙本事。

DeepMind团队表示,Alpha Go的关键在于使用的深度神经网络,实际上,在Alpha Go中有两种不同的神经网络,第一种叫做政策网络(policy network),用来预测下一步;第二种叫做价值网络(value network),用来预测棋盘上不同的分布会带来什么不同的结果。Alpha Go使用它们的方法是,把非常复杂的搜索树减少到可操作的规模。所以,它并不是在每一步都要考虑几百种步数,而只考虑政策网络提供的几十种最有前景的步法,价值网络的作用是减少搜索的深度,所以,它的搜索深度并不是特别深,它并不是一下子搜索出直达比赛末尾的300多步,而是搜索更少的步数,比如20多步,并评估这些位置,而不是一路评估到底,看谁最终能赢。搜索并不是靠蛮力,而是与某种与想象力很相似的东西。

领导这项研究的另一位Google研究者David Silver说:「围棋有着巨大的搜索空间,用蛮力很难解决。Alpha Go的关键在于,将搜索空间缩小到可以操作的范围。这个方法让Alpha Go比以前的方法都更像人类。」

Demis Hassabis说,围棋是人类发明的最复杂也是最美的游戏。通过战胜Fan Hui,「我们的程序赢得了长期以来一项重大人工智能挑战的胜利。而这项技术在Google的首个用途将是开发更好的个人助理软件。这样的个人助理能够从用户在线行为中学习用户偏好,并对产品和事件作出更符合直觉的建议。」

Hassabis还说道,他们用来创造Alpha Go的技术,也正是他的团队努力开发强人工智能的尝试。他说:「最终,我们想要将这些技术应用到真实世界的重要问题中。因为我们用的方法是通用的,我们希望有一天,它们能延伸得更广,帮助解决最紧迫的社会问题,从医药诊断到环境模型。」

实际上在几年前,大多数围棋选手和棋类程序员都相信,围棋实在是太困难了,必须要花上几十年的时间,计算机才能达到人类专业棋手的标准水平。对计算机来说,围棋比象棋的挑战更大,原因有二:每个回合可能存在的走法数量多得多,没有一个简单的方法来测算优势。所以,棋手只能学着在棋盘上几百个棋子中识别出抽象模式。即使是专家也经常会很难解释为什么一步棋看起来很有优势或有问题。

997年,当IBM深蓝计算机在象棋上称霸时,它使用的是手工编码的规则,在搜索时将穷尽所有可能发生的步法。Alpha Go从本质上则是随着时间而学习的,可以识别出可能具有优势的模式,然后模拟出数量有限的潜在结果。

Google的成就受到了广泛的祝贺,也引起了许多本领域研究者的惊讶。

新成立的非营利性组织OpenAI的AI研究者Ilya Sutskever说:「从技术的角度说,这个研究对AI具有纪念碑式的贡献。」他说,这个成果非常重要,因为Alpha Go从本质上教会了自己如何赢得比赛。「同样的技术也可以用于其他棋类游戏中,以获得高超表现。」

加拿大阿尔伯塔大学的计算机科学教授Michael Bowling最近开发了一个能在扑克牌上赢过人类的程序。他听到这个消息也很兴奋。他相信,这个方法在许多可以运用机器学习的领域都很有用。他说:「许多我们通常认为是人类智能的东西其实都构建于模式匹配上。许多被我们看做学习的东西,其实都是在过去看到了某些模式,然后意识到它们与现在的状况有何联系。」

纽约大学认知教授Gary Marcus说:「这不是所谓的端对端深度学习系统。而是精心建构的模块化系统,在前端具有一些缜密的手工操作,也就是说,几乎媲美人类心智:丰富,模块化,通过演化做出些微调整,而不仅仅是一束随机互联的神经元,完全通过经验做出调整。

首先,Yann LeCun解释了我们为什么要研究围棋?他说,作为一项非常困难的任务,围棋是一个很好的案例来验证各种学习技能的结合,包括模式识别、问题解决和规划等,也是一个可以用来测试新想法的工具,包括机器学习、推理和规划的结合。

Yann LeCun说,Facebook FAIR的一位科学家Yuandong在几个月前开始独立研究围棋项目,他开发了一款叫做「黑暗森林」的机器人。根据论文中的描述,最新版机器人将卷积神经网络和目前围棋机器人的经典方法——蒙特卡洛树搜索进行了有机结合。

此前,曾在2014年东京围棋擂台赛上通过让子以微弱优势战胜人类棋手的Crazy Stone就是依赖于蒙特卡洛树搜索,这是一套能够从本质上对每一步走法的所有结果都进行分析的系统。所以,有些机器能够非常精通西洋棋、国际象棋和其他棋类。它们比人类棋手看的更远,所以能够轻松的击败他们。但围棋不是这样,下围棋有太多的可能性需要考虑。在国际象棋的任何一个回合,平均可能的走法有35种。但围棋的走法却能达到250种。并且在这250种可能的走法之后,还对应着另外250种可能,以此类推。因此,用蒙特卡洛数搜索去计算每一步走法所带来的所有结果是不可能的。

武汉阳痿医院

专业治疗肾炎医院地址

南宁专业无痛人流哪家好

看牛皮癣医院的排名