您的位置:首页 > 编程语言 > Go语言

AlphaGo棋手Master战胜聂卫平与柯洁60连胜

2017-01-06 21:35 197 查看




AlphaGo棋手Master战胜聂卫平与柯洁60连胜


 幕后工程师为中国台湾人黄士杰

BY 氧分子网 ·
2017 年 01 月 06 日

北京时间1月5日消息,谷歌 DeepMind 开发的AI在围棋棋盘上战胜韩国世界冠军之后再度重返,这一次AlphaGo 在网上战胜了顶尖棋手,而且是悄悄进行的。最近几日,名为“Master”(大师)的神秘账号在各大围棋网站横扫顶尖职业棋手。

1月4日下午,神秘账号“Master”(大师)继续在野狐围棋网上挑战人类顶尖高手,第54局,中国棋圣、64岁的聂卫平出战。本局“Master”特意把比赛用时调整为每方1分钟一手,以示对聂卫平的尊敬。最终本局进行至手,执白的聂卫平以7目半的劣势落败。在Master揭开面纱神秘面纱之后,先前败给Master的世界围棋第一人柯洁也随即在微博上表示:“感谢AlphaGo最新版给我们棋界带来的震撼,作为一开始就知道真身是谁的我来讲,是多么希望网上的快棋人类能赢一盘。若不是住院,我将用上那准备了一个星期的最后一招…略有遗憾,希望这网络公测的最后一盘,古哥能发挥出人类的极限水平!@古力”



氧分子网www.yangfenzi.com)了解到,1月4日晚,随着古力认输,Master对人类顶尖高手的战绩停留在60胜0负1和。包括聂卫平、柯洁、朴廷桓、井山裕太在内的数十位中日韩围棋高手,在30秒一手的快棋对决中落败。总计
Master 上线短短5天打了61场比赛,以60战全胜的战绩收场(其中一场对手离线,判和局)。棋盘上打败人类的不止深蓝和AlphaGo!图灵、香农、冯·诺依曼

Master击败的棋手名单中,包括中国世界冠军:古力(3次),柯洁(3),陈耀烨(3),范廷钰(2),常昊(1),时越(1),芈昱廷(1),唐韦星(1),江维杰(1),柁嘉熹(1),周睿羊(1)。韩国世界冠军朴廷桓(5次),元晟溱(1),姜东润(1),金志锡(1),朴永训(1)。

此外,中华台北世界冠军周俊勋,日本第一人井山裕太落败。中国的连笑、檀啸、孟泰龄等新秀名将,女子第一人於之莹,韩国超级新锐申真谞等皆出战败北。



这个强悍的胜率加上落子如飞的下棋速度,让大家确信“大师”身后站的肯定是一个围棋人工智能。之前许多人都在猜测这位围棋高手是谁,大家都不确定,有人怀疑它是电脑。中国棋手古力悬赏10万元,寻找可以打败“Master”的棋手。

今天早些时候,谷歌 DeepMind 创始人德米什·哈萨比斯(Demis Hassabis)在Twitter发布消息,证实升级版 AlphaGo 在网上与真人对决。DeepMind 发布的消息显示,非正式测试可能已经结束,今年晚些时候,AlphaGo 将会参加一些正式比赛。

德米什·哈萨比斯写道:“在过去几天里,我们在网上进行了一些非正式围棋比赛,对局以快棋的形式进行……我们的目的只是为了查看系统是否如预期一样好。”他还说:“感谢那些在弈城围棋网和野狐围棋网与我们对弈的棋手,我们的账号是Magister(P) 和Master(P),我们还要感谢那些观战的人。”



一直以来,我们都在努力改进AlphaGo,在过去几天里,我们进行了一些非正式网上比赛,对局以快棋的形式进行,参加比赛的是最新开发的原型版系统,进行网上对决只是为了检查系统,看它是不是和预料的一样好。感谢那些在弈城围棋网和野狐围棋网与我们对弈的棋手,我们的账号是Magister(P) 和Master(P),我们还要感谢那些观战的人。

新版AlphaGo在比赛中下出了一些富有创意、非常漂亮的棋步,我们和围棋社区从中学到了许多东西,对此我们感到很兴奋,结果让人满意。AlphaGo之父戴密斯·哈萨比斯:除了下围棋,AI还要塑造人类未来

与AlphaGo对弈之后,棋手古力发帖称:“人类与AI携手合作,很快将会揭开围棋的深层秘密。”现在我们的非正式测试已经结束,今年我们准备与围棋组织、专家合作,举办正式、完整的比赛,进一步探索围棋的秘密,让人类与AI互相启迪,共同进步。很快我们就会公布更多消息。

AlphaGo的核心作者黄士杰:穿过狗的棋局的他的手



在去年初AlphaGo与南韩围棋名将李世乭(右)的对战中,黄士杰(左,Aja Huang)就是负责帮AlphaGo下棋的人。

中国围棋网站最近出现名为「Master」的神秘棋士,连败中、日、韩围棋冠军及多名好手,创下60连胜的佳绩,它的真实身分在4日晚间揭晓,原来是AlphaGo推手、台湾博士黄士杰(Aja Huang)。黄士杰是谷歌 DeepMind 的资深研究员,也是 AlphaGo 的主要程序开发者,台湾出身的黄士杰博士。黄士杰博士毕业于台湾师范大学,博士论文就是以“应用于电脑围棋之蒙地卡罗树搜索法的新启发式演算法”,本身也是业余六段的围棋棋手。刘黎平:史记《李世石大战阿尔法记》

黄士杰(Aja Huang)不久前在Facebook写到:

我们最近很努力地开发AlphaGo,刚过去的几天我们在网络的对弈平台进行了一些非正式的快棋对局,目的是为了检验我们最新版本的AlphaGo是否如我们的预期。我们感谢所有与我们的 Magister(P) 和 Master(P)帐户在弈城围棋网以及野狐围棋网对弈的棋手,也要感谢所有观战的人!最新版的AlphaGo在对局中所富有启发性的创新,我们从中可以学到的,以及对局的结果都令我们非常激动。

世界冠军古力九段与AlphaGo对局以后,说“人类与人工智能共同探索围棋世界的大幕即将拉开”。我们现在结束了非正式的测试,非常期望今年能有机会与围棋组织以及专家共同探索围棋,在相互启发的气氛中共同领会围棋的奥妙。我们希望尽快发布其他公告。



AlphaGo的核心作者黄士杰:穿过狗的棋局的他的手

2016年3月,由谷歌公司开发的人工智能软件,以4比1的总比分击败韩国棋王李世石,引起全世界范围内的关注,AlphaGo的幕后推手,台湾工程师黄士杰也吸引了众多媒体的关注。黄士杰是谷歌设计团队中最熟悉围棋的工程师,被台湾媒体爱称为“帮AlphaGo下棋的人”。

AlphaGo 开发成员黄士杰表示:‘我在师大学习的论文,成为我做出 AlphaGo 的基础。’并表示:‘我觉得台湾很多工程师都很厉害,但是一方面我们的资源比较少、一方面很多人都比较没有信心。’鼓励台湾开发者要勇敢走出去。更多AlphaGo解读:www.yangfenzi.com/tag/alphago

黄士杰从小热爱围棋,在台湾师大读书时就曾经创办了学校的围棋社,还曾获得大专杯围棋赛冠军,是个业余六段围棋选手。黄士杰硕士论文的指导老师林顺喜提起少年的他仍然非常骄傲,据林顺喜介绍,学生时代,黄士杰就醉心研究围棋软件开发,原本他5年就可以毕业,但为了延续自己的研发成果,又在学校多留了两年,直到他在台师大修业的第7年,他设计的软件参加国际电脑奥林匹克竞赛,获得19路电脑围棋金牌,他开发的程序更是击败了当时围棋AI公认最强的程序“Zen”,在业内引起极大的轰动。

黄士杰(Aja Huang),高中的时候在台北成功高中,拥有台湾交通大学(National Chiao Tung University)计算机与信息科学学士,台湾师范大学(National Taiwan Normal University)计算机科学与信息工程硕士与博士。在校取得了辉煌成绩的黄士杰通过博士论文口试之后就被加拿大阿尔伯塔大学(University of Alberta)挖走,担任电脑围棋程序研究员,1年后被英国一家专门研究人工智能的公司DeepMind 招揽,和David Silver并列首席设计师,2014年,DeepMind
公司被谷歌并购,黄士杰因此延续围棋程式开发,黄士杰已是公司内两位首席工程师之一。

黄士杰指出,人类在下围棋,除了平常的计算之外,最主要的是因为‘直觉’。透过这个原理,DeepMind 直接让 AlphaGo 跟深度学习结合,主要的网路是‘策略网路’跟‘值网路’,策略网路可以判断出最佳棋路,就好像人类用直觉来下出好棋一样,开发团队也会事先给 AlphaGo 阅读各种不同参考棋谱。至于‘价网路’则是在搜寻一个点之后,会判对盘面,搜寻谁优势,主要功能就是判断优势。

简而言之,策略网路减少搜寻的广度,价值网路著重减少搜寻的深度,黄士杰表示,其实 DeepMind 团队已经把所有开发过程与论文内容上网对外公开,让任何人都可以复制 AlphaGo 的技术,甚至他也发现已经有网友翻译成繁体中文版。《自然》论文详解:AlphaGo
背后的深度神经网络和树搜索


针对未来发展方面,黄士杰表示,DeepMind 有兴趣的领域除了围棋之外,还有‘医疗’跟‘机器人’,希望能够让世界变得更美好,至于他自己个人的下一步,当然就是选一个有兴趣的领域去投入。现场有媒体再次询问下一个目标是不是挑战《星海争霸》、《英雄联盟》这个模拟策略游戏领域,黄士杰并没有把话说死,表示:‘内部还在讨论’。除了AlphaGo,Google人工智能公司DeepMind要进军医疗保健领域



导师林顺喜口中的黄士杰

黄士杰在台师大读硕博时的导师林顺喜,指导了他的硕博论文《计算机围棋打劫的策略》和《应用于计算机围棋之蒙特卡罗树搜寻法的新启发式算法》,博士论文中法国教授Rémi Coulom为共同指导老师。而这位Rémi Coulom研发的Crazy Stone是在AlphaGo之前最有名的围棋软件之一。林顺喜回忆,黄士杰是个很努力的学生,是台师大围棋社创社社长,就读时就有围棋业余6段的资格,而且黄士杰读硕士时就锁定围棋为他的研究课题。林顺喜说,为了写程序,黄士杰有时在实验室一呆就是16小时。

提到黄士杰研发的围棋程序“Erica”,林顺喜爆料,Erica其实就是黄士杰太太的英文名字。林顺喜说,黄士杰其实外表看起来很宅的,“在实验室的10年中,从没看他带女朋友过来,但突然有一天,黄士杰跟我说‘我要结婚了’,我还大吃一惊‘怎么都没看过你老婆!’”脸书主页显示黄士杰的太太Erica Huang,中文名字是陈淑贞,和黄士杰一样同是台湾人。2007年黄士杰博士四年级的时候,两人相识。整天与电脑程序打交道的黄士杰,在恋爱方面,并不输一般的文艺青年。黄士杰曾在脸书上贴出与太太Erica认识不久时候为她准备的一份别样的生日礼物,他用电子琴为Erica录制了一首曲子。黄士杰将这首曲子命名为《Erica之歌》,并调侃,从国中开始学习的电子琴,终于派上了用场。

学妹张晓茵笔下的黄士杰

或许,人们对他更多的了解来自于他的学妹——台湾围棋记者张晓茵。李世石在输掉与AlphaGo的第二局后,北京晨报记者与张晓茵取得了联系,希望请她讲讲关于黄士杰的故事,但张晓茵婉拒了,她说她已经将自己所了解的这位学长的故事写在了之前的文章里。在互联网上可以顺利搜索到那篇文章,这是张晓茵今年除夕时所写下的,而当时AlphaGo战胜了樊麾二段。看到这则消息的张晓茵马上想起了黄士杰:2007年就读台师大研究所期间,张晓茵召集了师大对围棋感兴趣的学弟学妹们创办围棋社。作为学长,就读资讯工程研究所的黄士杰加入围棋社,他当时是台湾业余6段,张晓茵说,自己有关于围棋AI的知识都是在那时听黄士杰所说。

专注于围棋AI研究开发的黄士杰为人低调,张晓茵透露,自己也是在去年才知道他加入了DeepMind,虽然张晓茵想多向他了解一些关于AlphaGo的信息,但黄士杰表示,AlphaGo是整个团队的贡献,很多事情目前都需要保密。但从黄士杰之后的声明和谷歌缜密的筹备与酝酿来看,张晓茵当时就表示,自己更看好AlphaGo。值得一提的是,张晓茵提到黄士杰也是一个音乐爱好者,甚至能自己用MIDI作曲并弹奏,“这样一位理性与感性兼备的计算机工程师所在的团队,开发出来的计算机程序,或许会想过把一些人性元素放进去”。人机大战结束了,AI
投资才刚刚开始




风口浪尖里的黄士杰

人们对AlphaGo越好奇,也就对它的开发者越感兴趣,但直到今天,黄士杰关于人机大战所发出的,也只有两条声明而已。

第一则声明与一个“谜”有关,此前很多网友在弈城注意到一个DeepMind的账号,这是一个英国账号,注册段位为5D,之后几次升降,在2015年9月16日升上弈城9D。2015年12月,DeepMind在弈城首次击败P号选手(即职业棋手),其后又相继战胜两个P号。专注于研究人工智能围棋的韩国六段金灿佑认为,该账号5D时的棋谱中,有明显的人工智能围棋软件痕迹。更多deepmind解读:www.yangfenzi.com/tag/deepmind

而且在此次人机大战开战前,李世石曾公开表示,AlphaGo此前与英国棋手樊麾的5局比赛他都已看过,此外他还在弈城的账号中看过另外的两局比赛,综合考量,李世石曾表示自己打败AlphaGo不在话下。之前就有专家称,弈城账号最多是AlphaGo的部分模块测试,如果以此评估AlphaGo的水平,必然会有巨大落差。

对于这些猜测,黄士杰今年1月29日给予回应称:“弈城的DeepMind是我本人在用的账号,并不是AlphaGo。我本人喜欢下围棋,棋力是台湾业余6段。但AlphaGo肯定是比我强太多了。”

黄士杰最近一次发声就是在人机大战期间,同样与一个“谜”有关——由于在AlphaGo与李世石的前两盘对弈中没有出现打劫,被外界质疑“是否有不能打劫的秘密协议”,黄士杰声明称:“这次比赛并没有所谓的不能打劫的保密协议……我们也想知道,AlphaGo在对阵李世石九段这种级别的棋手,打劫时的表现。”

本文转载自氧分子网http://www.yangfenzi.com)综合整理报道

·氧分子网http://www.yangfenzi.com)延伸阅读:

➤ 科大讯飞刘庆峰:人工智能全球决战未来十年

➤ Facebook
田渊栋评 DeepMind 深度强化学习的异步算法


➤ 信海光:机器战胜人类是宿命,但有一样它们永远学不会

➤ 我们该恐惧的,不是阿法狗,而是AlphaGo身后的Google与美国

➤ Star
VC投资商汤科技SenseTime,“明星+星探”双重落地人工智能
内容来自用户分享和网络整理,不保证内容的准确性,如有侵权内容,可联系管理员处理 点击这里给我发消息