GOOGLE UMETNA INTELIGENCA 'ALPHA GO ZERO' JE PRAVKAR PRITISNILA NA PONASTAVITEV, KAKO SE UČITI

Se spomnite (nejasno), kako ste se naučili hoditi, govoriti, voziti kolo ali voziti? Bilo je neurejeno in polno napak, a veščine, ki ste se jih naučili na ta način, so ostale. Zunaj živih sistemov je bilo težko zgraditi dovolj močne algoritme, da bi lahko sprejeli 'resnične izkušnje' in razvili lepljiva, prilagodljiva vedenja za umetno inteligenco.

No, Alpha Go Zero je pravkar to storil.

„Začne se s praznega lista in ugotovi samo zase, samo iz samoigre in brez človeškega znanja ali kakršnih koli človeških podatkov, značilnosti ali primerov ali posredovanja ljudi. Odkriva, kako igrati igro Go od prvih načel, «pravi profesor DeepMind, David Silver.

AI je imel več ponovitev, od katerih je bila vsaka pametnejša in sposobnejša od prejšnje. Prejšnja različica je uporabila ogromno bazo podatkov prejšnjih iger skupaj s kopico algoritmov, ki so jo usmerjali k zmagi. Tak pristop je vodil do poraza vodilnega svetovnega prvaka, profesionalnega igralca Go. Na področju pokra je AI Libratus pred kratkim odnesel najboljše svetovne igralce pokra za skoraj dva milijona dolarjev, tudi z učenjem s samoigro namesto s podatki o človeških igrah.

dawn davenport in johan kok

Zdaj, v tej najnovejši različici Alpha Go, je poučeval program umetne inteligence sama kako igrati Go - brez človeškega ozadja.

Z izvajanjem milijonov simulacij iger proti sebi je trajalo 40 dni, da se je iz nič naučil, kako premagati različico svetovnega prvaka. To se resnično spreminja, ne samo za Go, ampak tudi za odkrivanje novega znanja. Kako natančno ali popolno je vaše strokovno znanje o domeni? Tam je veliko več, da odkrijemo, nam sporoča ta fascinantni eksperiment pri učenju z Alpha Go Zero.

'Ideja Alpha Go ni, da gre ven in premaga ljudi, ampak dejansko odkrije, kaj pomeni ukvarjati se z znanostjo - za program, ki se lahko sam od sebe nauči, kaj je znanje,' pravi Silver v objavi v YouTubu o dosežek.

Skupina Alpha Go Zero Deep Mind temu pravi prvovrstno učenje, 'tabula rasa' (prazen list).

'Če lahko dosežete tabula rasa pri učenju imate agenta, ki ga lahko presadite iz igre Go v katero koli drugo domeno, in glede na značilnosti igre, v kateri ste, izdelate algoritem, ki je tako splošen, da ga je mogoče uporabiti kjer koli, «pravi . To je provokativna ideja, ko razširite koncept. Samo pomislite, kaj bi lahko storili z nizom močnih učnih algoritmov, ki bi se lahko sistematično lotili težkih problemov in se učili hitreje kot kolektivno znanje naše civilizacije. . . v dneh, ne desetletjih.

koliko je vreden boomer esiason

Za zdaj je največja težava: 'algoritmi so pomembni bolj kot računalništvo ali razpoložljivi podatki,' je dejal Silver. Že samo to spreminja igro našega pristopa k širjenju znanega sveta. Medtem ko Alpha Go s približno 25 milijoni dolarjev strojne opreme - to ni ravno lahek sistem - veste, da guruji AI že dolgo delajo na ustvarjanju čistejših in boljših naborov podatkov. Danes mnogi nabori velikih podatkov veljajo za preveč hrupne - polne slabih podatkov -, da bi natančno usposobili umetno inteligenco. Če se AI uči iz podatkov in so podatki slabi, se ne nauči. Velik problem.

Kaj če ne bi potrebovali čistih podatkov, ampak le izkušnje in bi se umetna inteligenca lahko usposobila?

To je vznemirljiv dosežek v Alpha Go Zero. Čeprav gre za nišni svet, ki temelji na pravilih, ima velike posledice v vsaki panogi, ki temelji na fizičnih pravilih - pomislite na kemijo, promet, biologijo, farmakologijo, potovanja, logistiko in proizvodnjo. Če lahko oblikujemo pravila, ki so tako prožna, da lahko delujejo iz širših izkušenj in tako usmerjena, da vedno ustvarjajo močnejše spretnosti - kot je Alpha Go Zero -, potem je mogoče doseči umetno inteligenco, ki vodi sisteme. Ti sistemi ne bi potrebovali zunanjih podatkov, ne bi imeli težav s čiščenjem podatkov in ne bi potrebovali upočasnitev človeka v zanki. Prav zato je Googlovo matično podjetje Alphabet stavilo podjetje na umetno inteligenco in hitro vlaga v umetno inteligenco. (Amazon vlaga tudi v umetno inteligenco, tako kot najnovejša pridobitev AI BodyLabs.)

koliko je star thomas petrou 2020

Profesor Deep Mind David Silver pravi: 'Dejstvo, da smo videli program, ki dosega visoko stopnjo uspešnosti ..., bi moralo pomeniti, da se lahko zdaj lotimo nekaterih najzahtevnejših in najhujših problemov za človeštvo.'

Ta objava je bila posodobljena, da pojasnjuje, da je AI Libratus pred kratkim premagal vrhunske igralce pokra z uporabo strategije, ki vključuje samoigro in ne vnesene podatke.