Dezvoltat de | Google DeepMind |
---|---|
Tip | Software-ul jocului Go |
Site-ul web | Site-ul oficial |
AlphaGo este un program de calculator capabil să joace jocul Go , dezvoltat de compania britanică Google DeepMind .
În octombrie 2015, devine primul program care învinge un jucător profesionist (francezul Fan Hui ) pe un goban de dimensiuni complete (19 × 19) fără handicap. Acesta este un pas simbolic puternic, deoarece programul Go player este atunci o provocare complexă pentru inteligența artificială . Înmartie 2016L-a învins pe Lee Se-dol , unul dintre cei mai buni jucători din lume (al 9- lea dan profesionist). 27 mai 2017, îl învinge pe campionul mondial Ke Jie și se anunță retragerea software-ului.
De AlphaGo algoritm combină de învățare automată și graficul traversal tehnici , asociate cu o mulțime de formare cu oameni, alte computere, și mai ales el însuși.
Acest algoritm va fi îmbunătățit în continuare în versiunile ulterioare. AlphaGo Zero înoctombrie 2017atinge un nivel superior jucând doar împotriva sa. AlphaZero în decembrie 2017 depășește în mare măsură, întotdeauna prin auto-învățare, nivelul tuturor jucătorilor umani și software, nu numai în mișcare, ci și în șah și shōgi .
Programarea unui jucător Go este considerată o problemă mult mai dificilă decât pentru alte jocuri, cum ar fi șahul , din cauza multor combinații posibile, dar și pentru că condiția victoriei și obiectivele intermediare sunt mult mai puțin clare, ceea ce face extrem de complexă utilizarea metodelor tradiționale precum căutarea exhaustivă . Când computerul IBM Deep Blue l-a învins pe campionul mondial la șah Garry Kasparov în 1997, computerele erau apoi limitate la nivelul jucătorilor amatori slabi la jocul Go.
Lumea cercetării vede această dificultate ca pe o provocare și își îmbunătățește algoritmii, iar nivelul programelor accelerat în anii 2010 . În 2012, programul Zen l-a învins de două ori pe Takemiya Masaki (al 9- lea dan), cu un handicap de 5 și 4 pietre. În 2013, Crazy Stone l-a învins pe Yoshio Ishida (al 9- lea dan) cu un handicap de 4 pietre.
La începutul anului 2016, Facebook a anunțat că are rezultate încurajatoare dintr-o inteligență artificială dezvoltată intern numită Darkforest.
AlphaGo a fost dezvoltat de DeepMind Technologies , o companie britanică specializată în inteligență artificială creată de Demis Hassabis , Mustafa Suleyman și Shane Legg în 2010 și achiziționată de Google în 2014.
AlphaGo reprezintă o îmbunătățire semnificativă față de programele go anterioare . Din 500 de jocuri jucate împotriva altor programe, inclusiv Crazy Stone și Zen, AlphaGo a pierdut doar unul.
În octombrie 2015, AlphaGo îl învinge pe campionul european Fan Hui (al 2 - lea dan), cu 5-0 în jocurile lente și cu 3-2 în jocurile rapide. Aceasta este prima dată când un program de Go a bătut un jucător profesionist într - un meci-handicap gratuit de pe un plin : dimensiune (19 x 19) Goban . Știrea a fost anunțată doar pe27 ianuarie 2016pentru a coincide cu publicarea unui articol în revista Nature care descrie algoritmul utilizat.
AlphaGo se confruntă martie 2016jucătorul sud-coreean Lee Se-dol (al 9- lea profesionist, nivel maxim), considerat cel mai bun jucător din lume între 2000 și 2010. Meciul, care a câștigat un premiu de un milion de dolari, este difuzat și comentat în direct pe internet. Lee Sedol primește 150.000 de dolari pentru participarea sa și 20.000 de dolari pentru fiecare joc câștigat.
Meciul din 5 părți se încheie cu computerul câștigând cu 4-1:
Chiar înainte de ultimul joc și a asigurat victoria, AlphaGo este pe locul 9 - lea profesionale dan honorarily de Hanguk Kiwon (coreeană Go Joc Federația). Premiul de 1 milion de dolari, câștigat de echipa AlphaGo, este donat unor organizații caritabile.
Chiar înainte de întâlnire, alți profesioniști și-au exprimat dorința de a se opune AlphaGo, chiar dacă Ke Jie a simțit, având în vedere jocurile sale împotriva lui Fan Hui, că nu era un adversar demn. După meci, Lee Sedol a regretat că nu și-a dat tot potențialul și a dorit o revanșă. Dar nu a fost decât la începutul anuluiiunie 2016că perspectiva unei noi întâlniri a devenit mai clară, anunțul unui meci împotriva lui Ke Jie „înainte de sfârșitul anului” făcându-se în timpul Campionatului Mondial de Amatori de la Wuxi ; Însă6 iunie, Demis Hassabis a refuzat să confirme aceste informații.
18 iulie 2016, AlphaGo devine cel mai bun jucător din lume în clasamentul GoRatings , cu 3612 puncte Elo (contra 3608 în al doilea loc, Ke Jie ).
În septembrie 2016, comentariile detaliate ale jocurilor împotriva lui Lee Sedol, de Gu Li și Zhou Ruiyang (ro) și bazate pe analiza AlphaGo, au fost publicate pe site-ul DeepMind; Potrivit lui Gu Li, măiestria lui AlphaGo și profunzimea analizei sale depășesc tot ceea ce am spus deja în timpul meciului.
4 ianuarie 2017, Demis Hassabis anunță că o versiune îmbunătățită a AlphaGo tocmai a jucat o serie de 60 de jocuri rapide împotriva celor mai buni jucători din lume ( Ke Jie , Iyama Yuta , Gu Li , Park Jeong-hwan (ro) ...), jocuri care ea a câștigat cu toții și va juca meciuri oficiale mai târziu în an.
De la 23 la 27 mai 2017, un festival numit Summitul Viitorul Go este organizat de Google și de asociația chineză weiqi din Wuzhen ; cea mai recentă versiune a AlphaGo se confruntă cu Ke Jie într-un meci de trei jocuri, alături de alți profesioniști chinezi care joacă în consultare. Din nou, AlphaGo câștigă toate jocurile jucate. După această întâlnire, Google anunță că AlphaGo nu va mai juca competitiv, ci va publica documente tehnice care descriu ultimele lor îmbunătățiri și un set de jocuri jucate de mașină împotriva sa; de asemenea, intenționează să dezvolte un instrument de analiză bazat pe acest software pentru utilizarea jucătorilor.
17 octombrie 2017, DeepMind anunță o nouă dezvoltare, pe care o numesc AlphaGo Zero ; acest program folosește o arhitectură simplificată și începe de la cunoașterea zero a jocului (doar regulile); jucând doar împotriva sa, el ajunge la nivelul de începător în trei ore, bate versiunea după ce l-a învins pe Lee Sedol după 72 de ore 100 la 0, iar după 40 de zile bate versiunea deMai 2017 (cunoscut sub numele de „Maestru”) 89 de jocuri din 100.
5 decembrie 2017, o nouă versiune numită AlphaZero generalizează în continuare acest algoritm, obținând un program generic capabil să învețe să joace go, șah sau shōgi din simpla cunoaștere a regulilor; programul reușește în câteva ore să bată cele mai bune programe existente (de exemplu, pentru șah, obține după patru ore de învățare o victorie clară asupra Stockfish : din 100 de jocuri , 25 de victorii cu White, 3 cu Black și 72 de remize ).
Primele versiuni ale AlphaGo folosesc metoda Monte Carlo , ghidată de o „ rețea de valori ” și o „ rețea de politici ” (o rețea de valoare și o rețea de obiective ), ambele implementate folosind o rețea neuronală profundă .
AlphaGo a fost inițial instruit pentru a „imita” jucătorii umani, urmărind hiturile înregistrate în zeci de mii de jocuri desfășurate de jucători experți. Odată ce a atins un anumit nivel, a practicat să joace milioane de jocuri împotriva altor instanțe ale sale, folosind învățarea de întărire pentru a se îmbunătăți.
Cu toate acestea, în octombrie 2017, DeepMind publică un nou studiu în Nature , care descrie AlphaGo Zero , o arhitectură simplificată care nu mai folosește nici metoda Monte-Carlo, nici cunoștințele umane, dar, cu toate acestea, realizează foarte repede performanțe mai mari decât versiunile anterioare.
Algoritmul AlphaGo (sau cel puțin ideile sale esențiale) fiind făcut public, mai multe grupuri au încercat să îl reproducă sau chiar să îl îmbunătățească. Începând din 2018, în special, un proiect de colaborare și open source , Leela Zero , a obținut rezultate similare într-un an, portabil pe computerele personale și chiar pe smartphone-uri.