Google AI descoperire: Mintea profundă poate învăța fără intrare umană

Vă rugăm să împărtășiți această poveste!

Google se află în topul companiilor care doresc tehnocrație globală, iar presiunea lor pentru AI autonomă amenință chiar nucleul societății mondiale. Amenințarea este reală, dar puțini cetățeni înțeleg complexitatea acestei tehnologii.  Editor TN

Nu cu mult timp în urmă, stăpânirea jocului chinez antic al lui Go nu a fost la îndemâna inteligență artificială. Dar apoi AlphaGo, jucătorul AI Google DeepMind, a început să plece chiar și cei mai buni adversari umani din praf. Cu toate acestea, chiar și această AI care bate lumea avea nevoie de oameni din care să învețe. Apoi, miercuri, noua versiune a DeepMind a scăpat oamenii.

AlphaGo Zero a depășit abilitățile predecesorului său, ocolind metoda tradițională de învățare a jocurilor AI, care presupune vizionarea a mii de ore de joc uman. În schimb, pur și simplu începe să joace la întâmplare, respectându-și abilitățile jucând în mod repetat împotriva sa. Trei zile și 4.9 milioane de astfel de jocuri mai târziu, rezultatul este cel mai bun AI-joc Go-playing din lume.

„Este mai puternic decât abordările anterioare, deoarece am eliminat constrângerile cunoașterii umane”, spune David Silver, cercetătorul principal pentru AlphaGo.

„Omenirea a acumulat cunoștințe Go din milioane de jocuri jucate de-a lungul a mii de ani”, scriu autorii în lucrarea lor. "În câteva zile ... AlphaGo Zero a fost capabil să redescopere o mare parte din aceste cunoștințe Go, precum și strategii noi care oferă noi perspective asupra celor mai vechi jocuri."

Abordarea alternativă a AlphaGo Zero i-a permis să descopere strategii pe care oamenii nu le-au găsit niciodată. De exemplu, a învățat multe josekis diferite - secvențe de mișcări care duc la pierderea netă pentru ambele părți. Foarte mulți joseki au fost notați pe parcursul miilor de ani în care s-a jucat Go și inițial AlphaGo Zero a aflat multe dintre cele cunoscute. Dar, în timp ce autoformarea sa a continuat, a început să favorizeze secvențe necunoscute anterior.

Pentru a testa aceste noi mișcări, DeepMind s-a impus cu AlphaGo Zero împotriva versiunii care a bătut campionul mondial 18, Lee Sedol. Într-un joc 100 chibrituri potrivite, a câștigat 100-0. Acest lucru este în ciuda doar antrenamentului timp de trei zile, în comparație cu câteva luni pentru predecesorul său. După 40 zile de antrenament, a câștigat și 89-11 împotriva unei versiuni mai bune a AlphaGo care a învins numărul unu mondial Ke Jie (NaturăDOI: 10.1038 / nature24270).

Citește povestea completă aici ...

Mă abonez
Anunță-mă
oaspete

0 Comentarii
Feedback-uri în linie
Vezi toate comentariile