【IT時代網編者按】這段時間以來,大家都在關注李世石和谷歌人工智能的圍棋比賽,人們紛紛猜測究竟誰會成為贏家。撥開紛紛擾擾的論斷,我們冷靜地思考,其實這場決賽,無論誰嬴誰輸,我們都不必過于驚喜或者失望,即便李世石贏了,他也抵擋不住科技的進步,今天也許會贏,人工智能的勝利注定在我們開不到的未來。
決戰之日即將到來。
下周,韓國九段頂尖中國圍棋高手李世石(LeeSe-dol)將與谷歌人工智能項目AlphaGo在首爾四季酒店展開對決,整個比賽分五輪進行(這是你要了解的第一件事)。
賽程:3月9日、3月10日、3月12日、3月13日、3月15日。
規則:貼目7.5目(向后下棋的選手貼目7.5目)。每位棋手各有兩個小時的布局時間,3次60秒的讀秒。
獎金:100萬美元;谷歌已經表示,如果AlphaGo獲勝,獎金將捐贈給聯合國兒童基金會(UNICEF)、STEM教育及圍棋慈善機構(GoCharity)。
P.S.貼目是圍棋術語。指黑方由于先手,在布局上占有一定的優勢,為了公平起見,在最后計算雙方所占地的多少時,黑棋必須扣減一定的目數或子數。中國采用的是7.5目的大貼目規則,日本、韓國則為6.5目。
▎雙方都撂狠話:我們必勝!
第二件事是,到目前為止,雙方都深信自己將贏得勝利。
2月22日,李世石在首爾韓國棋院接受賽前采訪時說:“老實講,PanHui和AlphaGo的比賽水準沒有達到我與AlphaGo比賽的水平。我聽說AlphaGo一直在升級,就在我們談話時它還在繼續進步,所以說,相比于10月的比賽,我所面臨的挑戰會更大。盡管如此,我占據優勢的事實是不會改變的。對我而言勝利是一定的,現在只剩下贏得完美不完美的問題了。”
谷歌DeepMind卻表示,人工智能程序有自動學習的能力。
DeepMind工程總裁DemisHassabis在2月初曾表示:“實際上整個比賽就是我們的DeepBlue時刻。”Hassabis還說,大多的圍棋玩家都認為李世石將戰勝AlphaGo,Hassabis補充道:“他們認為我們獲勝的機率只有5%……但我們的系統進步很快,這點是他們沒有意識到的。就在我們談話時,它正在進步。”
對于Hassabis而言,AlphaGo項目的意義并不僅僅只是打敗世界級的圍棋選手。開發AlphaGo程序的方法可以應用在其它人工智能項目中,包括無人駕駛汽車、類人虛擬助手。“我們認為人工智能正在為這些問題提前解決一個元問題。”Hassabis說。
▎AlphaGo怎么運行的?
這是第三件事。
許多人很好奇,到底是什么讓AlphaGo變得如此成功?難道其它人工智能就失敗了嗎?
“傳統搜索樹會考慮所有可能性,但它用在圍棋上行不通。”Hassabis說。正因如此,谷歌DeepMind團隊才用兩套神經網絡為AlphaGo開發了一個全新的系統。我們可以將圍棋視為一個包涵所有可能性的樹,它能夠無限延伸。AlphaGo要做的就是利用兩套神經網絡來縮小可能性。它會利用策略網絡來判斷什么行為可能性最高,系統應該考慮怎么走好下一步。AlphaGo會將搜索樹的寬度變窄。還有一個就是價值網絡,它告訴AlphaGo怎么移動對白子和黑子都更好,這樣就可以降低可能性的深度。
在行動之前,DeepBlue超級電腦要考慮大約200萬步,AlphaGo卻只需要考慮10萬步。機器比人類專業選手考慮得遠,人類只能向前看1000步。DeepMind分別對兩套神經網絡進行訓練。
策略網絡可以模仿職業圍棋選手下棋,然后讓電腦下棋1300萬次來改進系統。最終。DeepMind會從每一個集合中挑選黑子或者白子的一邊,從而組建一個新的數據集。接下來價值網絡上場,DeepMind會利用好數據集,讓它來決定棋局中每一個位置上誰會獲勝。由此開始,DeepMind團隊會將兩個網絡結合,用MonteCarlo樹搜索來搭建最終的AlphaGo。“AlphaGo就是一個系統,它可以自己學習,然后將學到的東西寫成算法。事實上,它跟人類學習和下圍棋很接近。”Hassabis解釋說。
有些高深莫測?其實,你可以認為AlphaGo就是一個實驗,它不是編程程序,事實上連AlphaGo和它的自己創造者都無法解釋其是如何下棋的,但它卻是擁有了這種能力——或許這是一種直覺,通過不自覺的推理得到知識——到現在為止,我們普遍認為這是屬于人類的特權,就如牛頓在其《自然哲學的數學原理》第二版中序言中所寫到,“我不做假設,我只是知道。”
P.P.S.關于AlphaGo的演示視頻我們沒找到,但我們找到了一個Facebook類似項目的。盡管沒有谷歌的NB,但憑借11萬次的運算,其在著名的覆蓋全球的網絡圍棋社區KGS的年度比賽中拿到了第三名。
▎是博弈也是試驗
我們需要思考的更多一些,這是第四件事情。
人工智能是否能夠戰勝人類大腦?這個問題已經爭論很久了,不論圍棋大戰誰勝誰負,它都將為問題的答案奠定基礎。
如果李世石獲勝,某些人可以輕松地長舒一口氣了,因為他們之前曾擔心人工智能會入侵到人類占據統治地位的一些領域中去。如果AlphaGo獲勝會怎么樣呢?它可能會向我們描繪出一個反烏托邦的未來,在那里人類可憐無助,像牽線木偶一樣被機器人大腦控制著,正如科幻電影《機械公敵》描述的一樣。
開發AlphaGo的是谷歌DeepMind,它原本是一家英國公司,2014年時被谷歌收購。DeepMind認為電腦會進入到一些需要進行創造性思考的領域,這預示著未來人類和人工智能的關系會變得更緊張。
許多專家認為要想知道人工智能是否真的具有創造性思維,圍棋是最好的測試工具,因為它依賴直覺、非常復雜。在其它領域人工智能已經超過了人類,包括國際象棋——1997年,IBM的超級計算機“深藍”便打敗了當時國際象棋的世界冠軍卡斯帕羅夫。但在圍棋中,棋子可能的位置數比宇宙中的原子數還要多,并且遠遠超過國際象棋棋子可能的位置數——這一領域,仍然被人類所支配著。
最后一件事情是,你這回可以親自見證這個歷史時刻。
據悉,這次谷歌AlphaGo與李世石的對決將通過YouTube進行直播(在DeepMind的官方頻道,其已經上傳了與歐洲圍棋冠軍PanHui的比賽視頻),據傳在國內也會通過視頻網站和電視進行直播。英語解說將由邁克爾·雷德蒙(MichaelRedmond)來擔當,其是西方世界唯一一位達到最高級別專業9段的圍棋選手。而韓語解說則為張赫宇(Chang-hyeokYu),目前其是韓國圍棋國家隊的主教練。【責任編輯/荊玉珍】
來源:智東西
IT時代網(關注微信公眾號ITtime2000,定時推送,互動有福利驚喜)所有原創文章版權所有,未經授權,轉載必究。
創客100創投基金成立于2015年,直通硅谷,專注于TMT領域早期項目投資。LP均來自政府、互聯網IT、傳媒知名企業和個人。創客100創投基金對IT、通信、互聯網、IP等有著自己獨特眼光和豐富的資源。決策快、投資快是創客100基金最顯著的特點。
小何
小何
小何
小何