我的机械网

搜索
查看: 844|回复: 3

AlphaGo团队:柯洁站在人类顶峰机器将自身进化

[复制链接]

73

主题

-73

回帖

-88

积分

限制会员

积分
-88
发表于 2017-9-6 21:32:34 | |阅读模式
各位网友请注意:我的机械网所有附件、百度网盘提取码、机械资料、PDF资料、压缩包文件均需要回帖后才能下载!
  (搜狐体育郭健5月24日发自浙江乌镇)今天上午,2017中国乌镇人工智能高峰论坛在浙江省桐乡市乌镇国际会展中心拉开帷幕。率先登上论坛发表主题演讲的是AlphaGo之父——Deepmind团队负责人德米什-哈萨比斯(DemisHassabis)。在名为《直觉和创造力》的主题演讲中,这位1976年出生的英国人详细阐述了AlphaGo的研发机理和进化过程。

  Deepmind公司于2010年在伦敦创立,2014年加入谷歌,目前有500名员工,其中包括250位研究科学家。其目标为通过打造实施人工智能的“阿波罗计划”来研发科学的新方式,从而“攻克智能,再用智能解决所有问题”。Deepmind为广大中国人所熟知是在去年,其研发的AlphaGo人工智能程序在五番棋较量中战胜前世界第一、韩国棋手李世?h,震惊全世界。
  在具体谈到AlphaGo之前,哈萨比斯首先提起了IBM深蓝与国际象棋棋王卡斯帕罗夫的经典战役。1997年34岁的卡斯帕罗夫与“深蓝”展开六盘“人机大战”。最终深蓝以2胜3和1负的战绩取得了决定性的胜利。
  “应该说,当时的深蓝还不是真正的人工智能,因为机器只是被动地接受了工程师预设的程序,”哈萨比斯指出,人工智能要能够达到在非程序预设情况下自主学习原始材料,并通过统一系统执行多种任务且具有深度学习和强化学习的能力。
  “我们最新的AlphaGo系统已经研发了三年的时间了,为什么最终会选择围棋作为突破口呢?因为计算机下围棋是非常困难的,其复杂程度让穷举搜索都难以解决问题,”哈萨比斯认为围棋不可能通过写出评估程序来决定输赢,同时搜索空间又太过庞大,这让它成为人工智能技术最好的试金石,“围棋不像象棋等游戏是靠计算来竞技的,它是靠直觉。另外围棋是筑防游戏,本来棋盘是空的,要往上面摆子,而不像国际象棋那样本来棋盘就已经固定了棋子的初始位置,因此需要盘算未来。另外在围棋中没有等级概念,所有棋子都是一样的,”哈萨比斯强调小小一子就有撼动全局的力量,“妙手如同受到天启,玄妙深奥!”哈萨比斯充满神秘感的说到。事实上,在昨天与柯洁的首回合较量中,AlphaGo就曾经弈出过这样的妙手。当执白的AlphaGo第54手“断”时,柯洁瞬间震惊了,“这种棋不可能在人类棋局中出现,AlphaGo就是围棋上帝!”
  在此前同李世?h的对局中,AphaGo也屡屡展现“妙手”的威力,并让对手得到了启迪,“我认为这给围棋引入了新思路,我感觉找到了自己下棋的理由,”李世?h赛后说。值得一提的是,AlphaGo与李世?h的五番棋较量吸引了2.8亿观众,媒体相关报道达到3.5万篇,也带动棋盘销售量增幅10倍。
  “直觉就是通过体验直接获得的初步感知,虽然无法表达出来,但可通过行为确认其存在和正误,”哈萨比斯说,“而创造力则是通过组合已有知识产生新颖或独特想法的能力。”他认为目前AlphaGo已经能够模仿人的直觉,而在创造力方面尽管所触及的领域有限,但它也已经显示出了具有这样的能力。“深蓝已经结束,AlphaGo才刚刚开始!”国际象棋棋王卡斯帕罗夫深有感触地说。
  “信息过载和系统冗杂是巨大挑战,开发人工智能技术可能是这些问题的元解决方案,同时通过人工智能技术将帮助我们更好理解人脑的奥秘,”哈萨比斯在其演讲行将结束时表示,同时他强调,“人工智能必须在伦理和道德框架内被恰当运用才能够造福人类。”
  此后登场的AlphaGo首席科学家大卫-席尔瓦(Dave Silver)详细介绍了AlphaGo运作的基本原理。“它采用的是卷积神经网络,一种包括了策略网络与价值网络的神经网络,”大卫表示,策略网络是为了确保AlphaGo选择最好的一步,而价值网络可以预测每一步之后谁要赢,“这是为未来的输赢做一个预测,不是静态的去看这一步棋下在哪里,”大卫强调以策略网络减少问题的宽度,而价值网络则减少了其深度。

  “首先我们要有人类专家的大量的数据库,这样通过策略网络调整,让机器可以走出和人类大师一样的棋,达到监督式学习的目的,同时为强化学习做好准备,”在谈到AlphaGo学习过程时大卫说,“我们用最好最可用的数据来训练它,而最好的数据不是来自人类,是来自它自己。自己做自己的老师,也就是说,这一代AlphaGo会成为下一代的老师。”通过自我对弈进行强化学习,正是AlphaGo最强大的地方之一。也正是这种令人类匪夷所思的“双手互搏”式学习方法让柯洁彻底打消了之后继续与人工智能作战的想法,“它进步和提升得太快了,我们人类仅靠自身是不能弥补这种差距的,”昨天首回合落败后,柯洁对记者如是说。
  值得一提的是,与一般人所设想的不同。新一代的AlphaGo运算量在不断减少,目前与柯洁的对弈的版本只是之前对战李世石时运算量的1/10。“深蓝每秒可以进行1亿次运算,而AlphaGo则要少得多。可以说,AlphaGo比深蓝更聪明,而不是更快,”大卫深入浅出地说。
  “围棋是人类历史上最古老、研究最深入的游戏,也是构建和理解运算的最佳实验台,”在谈到人机大战这个话题时大卫说,“柯洁已经站在了人类知识金字塔的最顶峰,而在围棋世界人工智能面临着巨大挑战。”面对挑战,通过与李世石的五番棋和与柯洁的首回合较量,AlphaGo已经交出了一份亮眼的答卷。未来,其团队期待着通过自我对弈这种强化学习方式所产生的新的策略和价值网络可以用于AlphaGo的下一个迭代中,这也就意味着机器或者说程序可以完全通过自身实现进化!(搜狐体育 郭健/文)

本帖子中包含更多资源

您需要 登录 才可以下载或查看,没有账号?立即注册 一键登录:

x

0

主题

5480

回帖

3万

积分

论坛元老

Rank: 8Rank: 8

积分
37048
发表于 2018-12-18 21:05:17 |
62762457
发表于 2020-4-22 20:34:10 |
很棒,继续加油
发表于 2021-11-30 13:28:22 |
很多天不上线,一上线就看到这么给力的帖子!
快速回复 返回顶部 返回列表