AlphaGo

informație

Dezvoltat de	Google DeepMind
Tip	Software-ul jocului Go
Site-ul web	Site-ul oficial

AlphaGo este un program de calculator capabil să joace jocul Go , dezvoltat de compania britanică Google DeepMind .

În octombrie 2015, devine primul program care învinge un jucător profesionist (francezul Fan Hui ) pe un goban de dimensiuni complete (19 × 19) fără handicap. Acesta este un pas simbolic puternic, deoarece programul Go player este atunci o provocare complexă pentru inteligența artificială . Înmartie 2016L-a învins pe Lee Se-dol , unul dintre cei mai buni jucători din lume (al 9- lea dan profesionist). 27 mai 2017, îl învinge pe campionul mondial Ke Jie și se anunță retragerea software-ului.

De AlphaGo algoritm combină de învățare automată și graficul traversal tehnici , asociate cu o mulțime de formare cu oameni, alte computere, și mai ales el însuși.

Acest algoritm va fi îmbunătățit în continuare în versiunile ulterioare. AlphaGo Zero înoctombrie 2017atinge un nivel superior jucând doar împotriva sa. AlphaZero în decembrie 2017 depășește în mare măsură, întotdeauna prin auto-învățare, nivelul tuturor jucătorilor umani și software, nu numai în mișcare, ci și în șah și shōgi .

Istorie

Context

Programarea unui jucător Go este considerată o problemă mult mai dificilă decât pentru alte jocuri, cum ar fi șahul , din cauza multor combinații posibile, dar și pentru că condiția victoriei și obiectivele intermediare sunt mult mai puțin clare, ceea ce face extrem de complexă utilizarea metodelor tradiționale precum căutarea exhaustivă . Când computerul IBM Deep Blue l-a învins pe campionul mondial la șah Garry Kasparov în 1997, computerele erau apoi limitate la nivelul jucătorilor amatori slabi la jocul Go.

Lumea cercetării vede această dificultate ca pe o provocare și își îmbunătățește algoritmii, iar nivelul programelor accelerat în anii 2010 . În 2012, programul Zen l-a învins de două ori pe Takemiya Masaki (al 9- lea dan), cu un handicap de 5 și 4 pietre. În 2013, Crazy Stone l-a învins pe Yoshio Ishida (al 9- lea dan) cu un handicap de 4 pietre.

La începutul anului 2016, Facebook a anunțat că are rezultate încurajatoare dintr-o inteligență artificială dezvoltată intern numită Darkforest.

Dezvoltare

AlphaGo a fost dezvoltat de DeepMind Technologies , o companie britanică specializată în inteligență artificială creată de Demis Hassabis , Mustafa Suleyman și Shane Legg în 2010 și achiziționată de Google în 2014.

AlphaGo reprezintă o îmbunătățire semnificativă față de programele go anterioare . Din 500 de jocuri jucate împotriva altor programe, inclusiv Crazy Stone și Zen, AlphaGo a pierdut doar unul.

Meci împotriva Fan Hui

În octombrie 2015, AlphaGo îl învinge pe campionul european Fan Hui (al 2 - lea dan), cu 5-0 în jocurile lente și cu 3-2 în jocurile rapide. Aceasta este prima dată când un program de Go a bătut un jucător profesionist într - un meci-handicap gratuit de pe un plin : dimensiune (19 x 19) Goban . Știrea a fost anunțată doar pe27 ianuarie 2016pentru a coincide cu publicarea unui articol în revista Nature care descrie algoritmul utilizat.

Meci împotriva lui Lee Sedol

AlphaGo se confruntă martie 2016jucătorul sud-coreean Lee Se-dol (al 9- lea profesionist, nivel maxim), considerat cel mai bun jucător din lume între 2000 și 2010. Meciul, care a câștigat un premiu de un milion de dolari, este difuzat și comentat în direct pe internet. Lee Sedol primește 150.000 de dolari pentru participarea sa și 20.000 de dolari pentru fiecare joc câștigat.

Meciul din 5 părți se încheie cu computerul câștigând cu 4-1:

AlphaGo a câștigat cu White, prin retragere după 3 ore și 39 de minute de joc.
Victorie AlphaGo cu negrii, prin abandon.
AlphaGo câștigă cu White, la retragere.
Victoria pentru Lee Sedol cu White (oferind un joc de calitate și descoperind un defect în software; această slăbiciune a AlphaGo va fi remediată în versiunile ulterioare), prin abandon.
AlphaGo câștigă cu White. Lee Sedol joacă negru la cererea sa, considerând că jocul ar fi mai valoros.

Chiar înainte de ultimul joc și a asigurat victoria, AlphaGo este pe locul 9 - lea profesionale dan honorarily de Hanguk Kiwon (coreeană Go Joc Federația). Premiul de 1 milion de dolari, câștigat de echipa AlphaGo, este donat unor organizații caritabile.

După meciul împotriva lui Lee Sedol

Chiar înainte de întâlnire, alți profesioniști și-au exprimat dorința de a se opune AlphaGo, chiar dacă Ke Jie a simțit, având în vedere jocurile sale împotriva lui Fan Hui, că nu era un adversar demn. După meci, Lee Sedol a regretat că nu și-a dat tot potențialul și a dorit o revanșă. Dar nu a fost decât la începutul anuluiiunie 2016că perspectiva unei noi întâlniri a devenit mai clară, anunțul unui meci împotriva lui Ke Jie „înainte de sfârșitul anului” făcându-se în timpul Campionatului Mondial de Amatori de la Wuxi ; Însă6 iunie, Demis Hassabis a refuzat să confirme aceste informații.

18 iulie 2016, AlphaGo devine cel mai bun jucător din lume în clasamentul GoRatings , cu 3612 puncte Elo (contra 3608 în al doilea loc, Ke Jie ).

În septembrie 2016, comentariile detaliate ale jocurilor împotriva lui Lee Sedol, de Gu Li și Zhou Ruiyang (ro) și bazate pe analiza AlphaGo, au fost publicate pe site-ul DeepMind; Potrivit lui Gu Li, măiestria lui AlphaGo și profunzimea analizei sale depășesc tot ceea ce am spus deja în timpul meciului.

4 ianuarie 2017, Demis Hassabis anunță că o versiune îmbunătățită a AlphaGo tocmai a jucat o serie de 60 de jocuri rapide împotriva celor mai buni jucători din lume ( Ke Jie , Iyama Yuta , Gu Li , Park Jeong-hwan (ro) ...), jocuri care ea a câștigat cu toții și va juca meciuri oficiale mai târziu în an.

De la 23 la 27 mai 2017, un festival numit Summitul Viitorul Go este organizat de Google și de asociația chineză weiqi din Wuzhen ; cea mai recentă versiune a AlphaGo se confruntă cu Ke Jie într-un meci de trei jocuri, alături de alți profesioniști chinezi care joacă în consultare. Din nou, AlphaGo câștigă toate jocurile jucate. După această întâlnire, Google anunță că AlphaGo nu va mai juca competitiv, ci va publica documente tehnice care descriu ultimele lor îmbunătățiri și un set de jocuri jucate de mașină împotriva sa; de asemenea, intenționează să dezvolte un instrument de analiză bazat pe acest software pentru utilizarea jucătorilor.

17 octombrie 2017, DeepMind anunță o nouă dezvoltare, pe care o numesc AlphaGo Zero ; acest program folosește o arhitectură simplificată și începe de la cunoașterea zero a jocului (doar regulile); jucând doar împotriva sa, el ajunge la nivelul de începător în trei ore, bate versiunea după ce l-a învins pe Lee Sedol după 72 de ore 100 la 0, iar după 40 de zile bate versiunea deMai 2017 (cunoscut sub numele de „Maestru”) 89 de jocuri din 100.

5 decembrie 2017, o nouă versiune numită AlphaZero generalizează în continuare acest algoritm, obținând un program generic capabil să învețe să joace go, șah sau shōgi din simpla cunoaștere a regulilor; programul reușește în câteva ore să bată cele mai bune programe existente (de exemplu, pentru șah, obține după patru ore de învățare o victorie clară asupra Stockfish : din 100 de jocuri , 25 de victorii cu White, 3 cu Black și 72 de remize ).

Algoritm

Primele versiuni ale AlphaGo folosesc metoda Monte Carlo , ghidată de o „ rețea de valori ” și o „ rețea de politici ” (o rețea de valoare și o rețea de obiective ), ambele implementate folosind o rețea neuronală profundă .

AlphaGo a fost inițial instruit pentru a „imita” jucătorii umani, urmărind hiturile înregistrate în zeci de mii de jocuri desfășurate de jucători experți. Odată ce a atins un anumit nivel, a practicat să joace milioane de jocuri împotriva altor instanțe ale sale, folosind învățarea de întărire pentru a se îmbunătăți.

Cu toate acestea, în octombrie 2017, DeepMind publică un nou studiu în Nature , care descrie AlphaGo Zero , o arhitectură simplificată care nu mai folosește nici metoda Monte-Carlo, nici cunoștințele umane, dar, cu toate acestea, realizează foarte repede performanțe mai mari decât versiunile anterioare.

Proiectul Leela Zero

Algoritmul AlphaGo (sau cel puțin ideile sale esențiale) fiind făcut public, mai multe grupuri au încercat să îl reproducă sau chiar să îl îmbunătățească. Începând din 2018, în special, un proiect de colaborare și open source , Leela Zero , a obținut rezultate similare într-un an, portabil pe computerele personale și chiar pe smartphone-uri.

Note și referințe

(fr) Acest articol este preluat parțial sau în totalitate din articolul din Wikipedia engleză intitulat „ AlphaGo ” ( vezi lista autorilor ) .

(în) Jethro Mullen, „ Computer scoruri mari câștig împotriva oamenilor în jocul antic al Go ” , CNN ,28 ianuarie 2016(accesat la 28 ianuarie 2016 ) .
Serge Abiteboul și Tristan Cazenave, „ Du-te: o mare victorie ... pentru informaticieni! » , Pe binar ,15 martie 2016(accesat pe 21 martie 2016 )
Clasament al celor mai buni jucători din lume , pe site-ul goratings.org
Numărul posibilelor jocuri rezonabile este imens, este estimat la 10.600 pentru un goban de 19x19, în timp ce pentru șah ar fi doar 10.120 ( numărul lui Shannon ), un număr în sine extrem de mare decât acele (10 80 ) particule ale universului ( vezi „ Computerul va bate omul la Game of Go? ” , pe reseaux-telecoms.net (consultat la 2 februarie 2016 ) ).
(ro) David Silver și Demis Hassabis , „ AlphaGo: Stăpânirea jocului antic Go with Machine Machine ” , pe Google Research Blog ,27 ianuarie 2016.
(en-SUA) Alan Levinovitz, " Misterul Go, jocul antic pe care computerele încă nu îl pot câștiga " , pe Wired ,12 mai 2014(accesat la 30 ianuarie 2016 ) .
(în) David Ormerod, „ Programul Zen computer Go îl bate pe Masaki Takemiya cu doar patru pietre! » , On Go Game Guru (accesat la 28 ianuarie 2016 ) .
(ja) „ 「アマ六段の力。天才かも」囲碁棋士コンピュターに敗れる初の公式戦 ” , MSN Sankei News,20 martie 2013(accesat la 27 martie 2013 ) .
(ro-GB) HAL 90210 , „ No Go: Facebook nu reușește să strice marea zi a AI a Google ” , The Guardian ,28 ianuarie 2016( citiți online , consultat la 14 martie 2016 )
(în) Amy Thomson , „ Google Buys UK Company Deepmind Artificial Intelligence ” pe Bloomberg.com (accesat la 22 februarie 2016 )
(în) Sarah Griffiths, „ Descoperire de inteligență artificială în timp ce software-ul Google îl învinge pe maestrul Go,„ cel mai complex joc conceput vreodată ” , Daily Mail ,27 ianuarie 2016(accesat pe 29 ianuarie 2016 ) .
(în) Chris Duckett, „ Google AlphaGo AI clean mătură campionul european Go ” , ZDNet ,28 ianuarie 2016(accesat la 28 ianuarie 2016 ) .
(în) „ Google realizează„ descoperirea ”AI învingând campionul GB ” , BBC News ,27 ianuarie 2016.
David Larousserie și Morgane Tual, „ Prima înfrângere a unui profesionist împotriva inteligenței artificiale ”, Le Monde.fr ,27 ianuarie 2016( citiți online , consultat la 10 martie 2016 ).
(în) David Silver, Aja Huang, Chris Maddison J. Arthur Guez, Laurent Sifre, George van den Driessche, Julian Schrittwieser Ioannis Antonoglou, Veda Panneershelvam Marc Lanctot, Sander Dieleman, Dominik Grewe, John Nham, Nal Kalchbrenner, Ilya Sutskever, Timothy Lillicrap, Madeleine Leach, Koray Kavukcuoglu, Thore Graepel și Demis Hassabis , „ Stăpânirea jocului Go cu rețele neuronale profunde și căutarea copacilor ” , Nature , vol. 529, nr . 7587,28 ianuarie 2016, p. 484–489 ( DOI 10.1038 / nature16961 , citit online , accesat la 28 ianuarie 2016 ).
(ro-GB) Samuel Gibbs , „ AI AlphaGo de la Google va prelua lumea 1 Lee Se-dol în transmisiune live ” , The Guardian ,5 februarie 2016( citiți online , consultat la 15 martie 2016 )
„ Cel mai bun jucător din lume învins de inteligența artificială într-un meci simbolic ”, Le Monde.fr ,9 martie 2016( citiți online , consultat la 9 martie 2016 ).
„ Go game: Lee Sedol pierde runda a doua împotriva inteligenței artificiale ”, Le Monde.fr ,10 martie 2016( citiți online , consultat la 10 martie 2016 ).
„ Go game: prima victorie a lui Lee Sedol împotriva inteligenței artificiale Google ”, Le Monde.fr ,13 martie 2016( citiți online , consultat la 13 martie 2016 )
„ Go game: victoria finală a inteligenței artificiale pe scorul de 4 la 1 ”, Le Monde.fr ,15 martie 2016( citiți online , consultat la 15 martie 2016 )
(în) „ Lee Se-dol arată AlphaGo beatable ” pe The Korea Times (accesat la 15 martie 2016 )
(în) hermesauto , „ AlphaGo de la Google primește clasamentul divin„ Go ” pe The Straits Times (accesat la 15 martie 2016 )
(în) „ În urma„ AlphaGo - Recenzii ale jucătorilor profesioniști Go ” [„ În urma AlphaGo: opiniile jucătorilor profesioniști ”], Federația Europeană Go ,2 februarie 2016.
„ «AlphaGo nu mă poate bate» , spune jucator profesionist de du - te Ke Jie, “ pe french.xinhuanet.com ,12 martie 2016(accesat la 27 mai 2016 ) .
(în) „ Campionul GB învins Lee Se-dol vrea o revanșă împotriva AlphaGo ” [„Lee Se-dol, du-te învingerea campioanei, vrea o revanșă împotriva AlphaGo”], pe independent.co.uk ,22 martie 2016(accesat la 6 iunie 2016 ) .
Clément Bohic, „ Inteligența artificială: următoarea provocare a AlphaGo se numește Ke Jie ” , pe ITespresso ,7 iunie 2016(accesat la 7 iunie 2016 ) .
Julien Cadot, „ Numărul 1 al jocului Go vrea răzbunarea umanității pe inteligența artificială ” , pe numerama.com ,6 iunie 2016(accesat la 6 iunie 2016 ) .
Karyl Ait-Kaci-Ali, „ AlphaGo: fără meci împotriva lui Ke Jie (deocamdată?) Spune DeepMind ” , pe CNETfrance.fr ,7 iunie 2016(accesat la 8 iunie 2016 ) .
Julien Lausson, „ AlphaGo devine cel mai bine clasat jucător din lume ” , pe numerama.com ,18 iulie 2016.
(în) Jocurile comentate și trei părți AlphaGo împotriva lui .
(de) Diagrame interactive (dar necomentate) ale acestor părți .
(în) Mesaj oficial de la Demis Hassabis .
(în) Anunț, rezultate și comentarii ale întâlnirii pe site-ul web al Deepmind .
Morgane Tual, „ AlphaGo se retrage ”, Le Monde.fr ,27 mai 2017( citește online ).
Acest instrument (un set de analize a 6000 fuseki (secvența de deschidere) jucat în mod obișnuit de profesioniști și amatori puternici) este disponibil online în toamna anului 2017 sub numele AlphaGo Teach (în) .
Morgane Tual, „ Inteligența artificială: din ce în ce mai puternică, AlphaGo învață acum fără date umane ”, Le Monde.fr ,18 octombrie 2017( citește online ).
(ro) David Silver, Julian Schrittwieser, Karen Simonyan, Ioannis Antonoglou, Aja Huang, Arthur Guez, Thomas Hubert, Lucas Baker, Matthew Lai, Adrian Bolton, Yutian Chen, Timothy Lillicrap, Fan Hui, Laurent Sifre, George van den Driessche, Thore Graepel și Demis Hassabis , „ Stăpânirea jocului Go fără cunoștințe umane ” , Natura , vol. 550,19 octombrie 2017, p. 354–359 ( DOI 10.1038 / nature24270 , citiți online ).
(în) David Silver, Thomas Hubert Julian Schrittwieser Ioannis Antonoglou Matthew Lai Arthur Guez, Mark Lanctot, Laurent Sifre, Dharshan Kumaran, Thore Graepel Timothy Lillicrap Karen Simonyan și Demis Hassabis , „ Mastering Chess and Shogi by Self-Play with a General Reinforcement Algoritm de învățare ” , arXiv ,5 decembrie 2017( citește online ).