Môže spoločnosť Google „Superhuman“ neurónovú sieť skutočne povedať polohu akéhokoľvek obrazu?

$config[ads_kvadrat] not found

I’m Really Scared To Admit This.

I’m Really Scared To Admit This.
Anonim

Vyhľadávanie obrázkov je jednoduchšie ako kedykoľvek predtým. Ale ak sa pokúšate nájsť obraz niečoho v mieste, ktoré nie je úplne zrejmé (nie egyptské pyramídy alebo obrovská palcová plastika v Paríži), je to ťažšie, než si myslíte - dokonca aj s informáciami o geografickej polohe založenými na tom, čo je na obrázku.

Zadajte inžiniera Google menom Tobias Weyand a pár jeho kolegov. Podľa nového článku v časopise arxiv (vyslovuje sa „archív“), trio vybudovalo stroj na hlboké učenie schopný určiť polohu takmer každej fotografie založenej výlučne na analýze jej pixelov.

Ak chcete získať stroj, aby úspešne splnil úlohu, ako je táto, chcete, aby mu schopnosť intuitívne informácie založené na vizuálne stopy. Chcete, aby si myslela, inými slovami, ako ľudská bytosť.

Weyand sa pustil do vývoja umelej neurónovej siete - strojového systému určeného na napodobňovanie neurologických dráh mozgu, ktoré mu umožňujú učiť sa, spracovávať a spomenúť si informácie ako človek. Tento nový systém, PlaNet, je zrejme schopný prekonať ľudí pri určovaní umiestnení obrazov bez ohľadu na to, aké nastavenie je - či už je to vnútorné alebo vonkajšie, a predstavuje akýkoľvek druh jedinečných alebo nepopierateľných vizuálnych podnetov.

Ako PlaNet worK? Weyand a jeho tím rozdelili mapu sveta na mriežku, ktorá položila viac ako 26 000 štvorcových tvarov v rôznych regiónoch v závislosti od toho, koľko snímok bolo na týchto miestach zhotovených. Husté miesta, kde sa do menšieho štvorca zapadá veľa obrázkov, zatiaľ čo väčšie, vzdialenejšie oblasti sa dajú rozrezať na väčšie štvorce.

Tím potom vytvoril veľkú databázu snímok, ktoré už boli geolokované - takmer 126 miliónov rôznych fotografií. Približne 91 miliónov sa použilo ako súbor údajov na učenie PlaNet, ako zistiť, ktorý obraz by sa mohol umiestniť do mriežky na mape sveta.

Potom bola neurónová sieť poverená geolokaciou ďalších 34 miliónov obrázkov z databázy. Konečne, PlaNet bol založený na dátovom súbore 2,3 miliónov geotagged obrázkov z Flickr.

Výsledky? PlaNet mohol určiť krajinu pôvodu pre 28,4 percent fotografií a kontinent pre 48 percent. Okrem toho by systém mohol určiť polohu ulice na úrovni 3,6 percent obrázkov Flickr a umiestnenie na úrovni mesta na úrovni 10,1 percenta.

A PlaNet je v tom lepší ako väčšina ľudských bytostí - dokonca aj najväčší globetrotéri. Weyand získal 10 dobre-cestoval jednotlivcov súťažiť proti PlaNet v hre označovania umiestnenie obrázkov nájdete na Google Street View.

"Celkovo, PlaNet vyhral 28 z 50 kôl so strednou lokalizačnou chybou 1131,7 km, zatiaľ čo stredná chyba lokalizácie človeka bola 2320,75 km," napísali vedci. "Tento malý experiment ukazuje, že PlaNet dosahuje nadľudský výkon pri úlohe geolokacie scén Street View."

Je to skutočné? Vyvinul inžinier Google naozaj len „nadľudský“ A.I. Systém?

Čo sa týka geolokačných snímok, možno. A to nie je až príliš prekvapujúce - bod A.I. nemá zásadne napodobňovať ľudský mozog vo všetkých smeroch, ale prekonať ľudské obmedzenia niekoľkými konkrétnymi spôsobmi, aby sa splnili oveľa ťažšie úlohy. Takže v tomto zmysle to, čo vedci píšu, je pravda.

Napriek tomu je to takzvaný „neurónová sieť“, ktorá volá PlaNet. Ideálna forma tohto druhu technológie by bola schopná naučiť sa oveľa viac než geolokácia obrazu. Ad interim systémy sú schopné písať simily a hrať Super mario, ale toto sú malé veci v porovnaní s ideálnym „master“ systémom, ktorý dokáže automaticky monitorovať a udržiavať vitály, riadiť dopravnú alebo energetickú infraštruktúru a mnoho ďalšieho.

$config[ads_kvadrat] not found