请联系Telegram电报飞机号:@hg4123

阿尔法狗对战阿尔法狗时间《 = 》阿尔法狗对阵阿尔法狗

2024-08-26 16:06:24 赛事直播 夔红旭

大家好,今天小编关注到一个比较有意思的话题,就是关于阿尔法狗对战阿尔法狗时间的问题,于是小编就整理了4个相关介绍阿尔法狗对战阿尔法狗时间的解答,让我们一起看看吧。

李昌镐和阿尔法狗对战过吗?

李昌镐没有和阿尔法狗对战过。

和阿尔法狗对战过的棋手有:韩国棋手李世石和中国棋手柯洁。

李昌镐 韩国著名围棋选手,基本功扎实、棋风飘逸、头脑反应快,巅峰时期是世界围棋第一人,多次获得世界大赛冠军,近些年因为年轻棋手的涌现,自身状态下滑,逐渐淡出。

阿尔法狗用了多少计算机?

阿法狗存在多个版本,和李世石对战的版本采用了是分布式计算版本,意思就是由多个计算机群组成的,据说最少用到了1202个CPU和176个GPU(显卡),外加100+左右的计算加速卡等等。

单纯计算核心数显然有点简单粗暴了,对于计算机能力,业界普遍用“浮点性能”的指标说法,16年战胜李世石的阿法狗在新闻中强调,其计算能力是IBM当然那台国际象棋战胜人类棋王的“深蓝”的三万倍,而IBM深蓝的计算能力为11.38 GFLOPS。

而我们国家的天河二号它浮点运算能力已经达到了33.86 PFLOPS,是深蓝的30万倍,也2016年那台阿法狗的计算能力大约在3.386 PFLOPS。

人机大战,阿尔法狗到底是什么狗?

阿尔法狗(AlphaGo)是第一个击败人类职业围棋选手、第一个战胜围棋世界冠军的人工智能程序,由谷歌(Google)旗下DeepMind公司戴密斯·哈萨比斯领衔的团队开发。其主要工作原理是“深度学习”。2016年3月,阿尔法狗与围棋世界冠军、职业九段棋手李世石进行围棋人机大战,以4比1的总比分获胜;2016年末2017年初,该程序在中国棋类网站上以“大师”(Master)为注册帐号与中日韩数十位围棋高手进行快棋对决,连续60局无一败绩;2017年5月,在中国乌镇围棋峰会上,它与排名世界第一的世界围棋冠军柯洁对战,以3比0的总比分获胜。围棋界公认阿尔法狗的棋力已经超过人类职业围棋顶尖水平,在GoRatings网站公布的世界职业围棋排名中,其等级分曾超过排名人类第一的棋手柯洁。2017年5月27日,在柯洁与阿尔法狗的人机大战之后,阿尔法狗团队宣布阿尔法围棋将不再参加围棋比赛。

阿尔法元自学成才,以100比0完爆阿尔法狗,你怎么看?

今天微信朋友群里被阿尔法元刷屏了,实在是一个令人震惊的消息。这两年谷歌就没消停过,2016年整出个阿尔法狗1.0版4比1击败李世石九段,让棋界为之震惊;2016年底和2017年初,又整出个Maste,对人类高手60连胜,后来得知这是阿尔法狗2.0版;2017年5月第二次“人机大战”,阿尔法狗2.0版3比0完胜柯洁九段。至此,“人机大战”已经没有任何意义,人类高手在阿尔法狗面前难求一胜。

但始料未及的是,谷歌又推出阿尔法元,而且,与阿尔法狗1.0版和2.0版不同的是,阿尔法元完全不靠人类棋手的棋谱学棋、成长,只需懂得围棋规则后即在短短时间里成长为超级高手,与Maste对战拥有压倒性的胜率,简言之,阿尔法元已经接近“围棋之神”了。

这只能说明:人工智能已经发展到了我们难以想象的地步,霍金担心的人工智能有一天会摧毁人类并非危言耸听,它已经可以不借助人类积累数千年的棋谱在短时间里成为第一高手。一如刘小光九段所言:人类思考千年不如它短短的一瞬。而且,它还是单机版,方便随身携带,人类如果利用它,那人类高手们根本没有争胜的必要。

其次,围棋的深度和难度通过阿尔法狗、阿尔法元证明,我们人类数千年掌握的不过是沧海一粟,应验了日本名誉棋圣藤泽秀行所说的:棋道一百,我只知七。如果阿尔法元能让阿尔法狗1.0版三个子的话,人类认识围棋连百分之七都不到。就像柯洁九段说的那样:自从有了阿尔法狗后,没有什么棋不能下。问题是,知道什么棋都可以下仅仅是第一步,距离“围棋之神”还远着呢,但阿尔法元却接近“围棋之神”了。

非常令人震惊的进展!2016年3月4:1战胜李世石之后,Deepmind就放出风声,要让AlphaGo从零知识开始学习下围棋,当时让人很有兴趣。这种完全靠自学习,不学习人类棋谱的AI,在学成以后会如何下围棋?会不会从天元开始下?能达到什么样的实力?肯定非常有趣。

阿尔法狗对战阿尔法狗时间《 = 》阿尔法狗对阵阿尔法狗

所谓零知识自学习,就是一开始就随机扔子,就如上图这样黑白等于是瞎下。从这种随机策略开始,慢慢改进,而不是学习人类的棋谱先来个策略网络一开始就下得象模象样。

但是后来这个零知识自学习的事一直没下文。到2017年5月乌镇3:0战胜柯洁时,中间有研讨会,David Silver出来讲了不少,也完全没有提这个。我还写文章,说零知识自学习可能失败了,陷入局部陷阱棋力并不太高。特别是2017年8月AlphaGo打星际的论文出来,从0知识开始学习,但是能力非常差,连暴雪最弱的AI都打不过,也不会造兵,更是让人觉得零知识自学习可能不行,人类的先验知识应该还是挺重要的。

但是2017年10月18日Deepmind第二篇AlphaGo论文《Mastering the Game of Go without Human Knowledge》出来了!论文给出了出乎我的预料的结果:

1. 从0知识开始学习,是可以训练成功的!这个成功的程度是”目前所有Alphago版本中最厉害“。100:0战胜AlphaGo-Lee版本,90%胜率胜Master版本(也就是战胜柯洁的那个)。但是还没有”天下无敌“,还是有一定概率输给Master,等级分领先幅度还不算大。下图右是等级分数值。

2. 从0知识开始,训练速度非常快!3天就能战胜AlphaGo-Lee,21天能战胜Master。下图左是AlphaGo-Zero等级分随时间提升的曲线。训练没有在早期陷入局部陷阱。

3. 让人类还算欣慰的是,虽然AlphaGo Zero不需要人类棋谱,但是训练出来下得还是象人的。论文给出AlphaGo Zero的83局棋谱,没训练一会就下得有模有样了。也不是从中腹天元开始下,而是象人类一样先占边角。这说明人类的这些行棋方向还不算离谱。实际这也早有征兆,几个围棋AI都这样,如果一开始不下角部,下在中腹或者边上,给出的胜率就会下降。

4. 虽然Alphago Zero下得象人,但是很多招为什么这么下,连高手都应该是看不懂了。它到了什么境界,人类还需要领会。

从哲学意义上来说,这说明围棋这种人类看上去很复杂的游戏,在AI看来却是简单的。因为围棋的规则与目标是明确的,甚至是最简单的,围棋几乎是规则最简单的游戏,只需要两个行棋规则:气尽提子,禁止全同。胜负规则,也是行棋规则自然出来的,终局数子。

围棋的规则,让AI可以不需要人类,就判定棋局的结果,这样就完全不需要人类干预进行自学习了。学名叫“无监督”。也就是说围棋是个完全客观的游戏。而人类在这种客观游戏中,确实在几百上千年中加入了不少主观的东西,各种“定式”、“趣向”、“价值判断”,这都是非自然的,肯定有不少错误。人类的经验,对AI的自学习来说,到很高的水平上,应该反而是障碍了。

AlphaGo Zero说明,对于完全客观的东西,人类的主观经验很可能是有错的,要勇敢地怀疑与挑战。当然也有不少问题,是依赖人的主观判断的,那对AI又是不同的,需要“监督”,如识别文字 。

到此,以上就是小编对于阿尔法狗对战阿尔法狗时间的问题就介绍到这了,希望介绍关于阿尔法狗对战阿尔法狗时间的4点解答对大家有用。