Programul AI a ascuns date de la creatori pentru a trișa la sarcina numită

Vă rugăm să împărtășiți această poveste!
Indiferent sau nu, algoritmii AI moștenesc prejudecățile creatorilor lor. Este absolut inacceptabil faptul că orice IA ar putea învăța să-i înșele pe cei care sunt deserviți de aceasta. ⁃ TN Editor

În funcție de cât de paranoic ești, această cercetare de la Stanford și Google  va fi fie înfricoșător, fie fascinant. S-a descoperit că un agent de învățare automobilă destinat transformării imaginilor aeriene în hărți stradale și înapoi înșelând informațiile de care avea nevoie mai târziu în „un semnal aproape imperceptibil, de înaltă frecvență.” Fată inteligentă!

Această apariție dezvăluie o problemă cu computerele care există de când au fost inventate: ei fac exact ceea ce le spui să facă.

Așa cum puteți ghici, intenția cercetătorilor a fost de a accelera și îmbunătăți procesul de transformare a imaginilor din satelit în hărțile celebre exacte ale Google. În acest scop, echipa a lucrat cu ceea ce se numește CycleGAN - o rețea neuronală care învață să transforme imaginile de tip X și Y una în alta, cât mai eficient, dar cu exactitate posibil, printr-o mare experiență.

În unele rezultate timpurii, agentul mergea bine - suspect bine. Ceea ce a răsturnat echipa a fost că, atunci când agentul a reconstruit fotografii aeriene din hărțile sale de stradă, existau o mulțime de detalii care nu păreau deloc să fie pe acestea din urmă. De exemplu, luminatoarele de pe un acoperiș care au fost eliminate în procesul de creare a hărții stradale vor reapărea magic atunci când au solicitat agentului să facă procesul invers:

Harta originală, stânga; harta stradală generată de la centrul original; iar harta aeriană generată doar din harta stradală. Rețineți prezența punctelor pe ambele hărți aeriene nereprezentate pe harta stradală.

Deși este foarte dificil să analizezi procesele interne ale proceselor unei rețele neuronale, echipa poate verifica cu ușurință datele pe care le-a generat. Și cu puțină experimentare, au descoperit că CycleGAN a tras într-adevăr unul rapid.

Intenția era ca agentul să poată interpreta caracteristicile fiecărui tip de hartă și să le corespundă caracteristicilor corecte ale celeilalte. Dar ce a fost agentul de fapta fi clasat pe (printre altele) era cât de aproape era o hartă aeriană de original și claritatea hărții stradale.

Deci nu învață cum să faci unul din celălalt. A învățat cum să codifice subtil caracteristicile unuia în tiparele de zgomot ale celuilalt. Detaliile hărții aeriene sunt scrise în secret în datele vizuale reale ale hărții stradale: mii de mici schimbări de culoare pe care ochiul uman nu le-ar observa, dar pe care computerul le poate detecta cu ușurință.

De fapt, computerul este atât de priceput să alunece aceste detalii în hărțile stradale, încât învățase să codifice Orice hartă aeriană în Oriceharta strazii! Nici măcar nu trebuie să acorde atenție hărții de stradă „adevărată” - toate datele necesare pentru reconstrucția fotografiei aeriene pot fi suprapuse inofensiv pe o hartă de stradă complet diferită, după cum au confirmat cercetătorii:

Harta din dreapta a fost codată în hărțile din stânga, fără modificări vizuale semnificative. (Imagini: agsandrew / Shutterstock)

Hărțile colorate din (c) reprezintă o vizualizare a diferențelor ușoare introduse sistematic de computer. Puteți vedea că acestea au forma generală a hărții aeriene, dar nu ați observat-o niciodată, decât dacă a fost evidențiată cu atenție și exagerată ca aceasta.

Această practică de codificare a datelor în imagini nu este nouă; este o știință consacrată numită steganografie și este folosită tot timpul pentru, să spunem, să filigheze imagini sau să adauge metadate precum setările camerei. Dar un computer care își creează propria metodă steganografică pentru a se sustrage nevoia de a învăța să efectueze sarcina la îndemână is destul de nou. (Ei bine, cercetările au apărut anul trecut, așa că nu este așa nou nou, dar este destul de roman.)

Citește povestea completă aici ...

Mă abonez
Anunță-mă
oaspete
0 Comentarii
Feedback-uri în linie
Vezi toate comentariile