Nový algoritmus MIT môže predpovedať ľudské interakcie predtým, než sa dostanú do rozpakov

$config[ads_kvadrat] not found

Dexter Lumis vs. Timothy Thatcher: WWE NXT, Nov. 11, 2020

Dexter Lumis vs. Timothy Thatcher: WWE NXT, Nov. 11, 2020
Anonim

Naša neschopnosť čítať iných ľudí viedla k niektorým epickým neúspechom a vynechaniu bozkov. Aj po celoživotnej skúsenosti je ťažké predvídať ľudské interakcie. Ale výskumníci z MIT Computer Science a Artificial Intelligence Laboratory si myslia, že môžu pomôcť: S novým algoritmom hlbokého učenia, ktorý dokáže predpovedať, kedy sa dvaja ľudia budú obdivovať, pobozkať, potriasť rukami alebo päťky, urobili veľký krok smerom k budúcnosti požehnane zbavený tých nepríjemných momentov.

Dúfajú, že ich nový algoritmus - vyškolený na 600 hodinách videí YouTube a televíznych relácií Kancelária, Scrubs, Teória veľkého tresku a Zúfalé manželky - možno použiť na naprogramovanie menej spoločensky nešikovných robotov a vývoj náhlavných súprav v štýle Google Glass na navrhnutie akcií pre nás skôr, než budeme mať šancu vynechať. V budúcnosti si budú predstaviť, že už nikdy nebudete mať šancu spolupracovať so svojím spolupracovníkom.

Uvedomiť si, že roboti sa učia byť sociálni rovnakým spôsobom ako my, bol kľúčom k úspechu algoritmu. „Ľudia sa automaticky učia predvídať akcie prostredníctvom skúseností, čo nás podnietilo k tomu, aby sme sa snažili napodobňovať počítače rovnakým spôsobom,“ hovorí CSAIL Ph.D. študent Carl Vondrick, prvý autor na súvisiacom príspevku, ktorý bol predstavený tento týždeň na medzinárodnej konferencii o počítačovom videní a rozpoznávaní vzorov. „Chceli sme ukázať, že práve sledovaním veľkého množstva videa môžu počítače získať dostatok vedomostí, aby mohli dôsledne robiť predpovede o svojom okolí.“

Vondrick a jeho tím učili viacnásobné „neurónové siete“ algoritmu, aby analyzovali obrovské množstvo údajov v tomto prípade, hodiny piatich a siedmich Jimových a Pamätných bozkov Mike a Susan. Vzhľadom na faktory, ako sú natiahnuté ruky, zdvihnutá ruka alebo dlhší pohľad, každá z neurónových sietí odhadla, čo sa bude diať v druhej sekunde, a všeobecný konsenzus sietí sa považoval za konečnú „predpoveď“ v študovať.

Algoritmus to spravil viac ako 43 percent času. Hoci sa to nemusí zdať dosť vysoké na to, aby zaručilo, že naše každodenné interakcie budú o niečo menej podivné, je to veľké zlepšenie existujúcich algoritmov, ktoré majú presnosť iba 36 percent.

Okrem toho ľudia môžu predvídať iba 71% času. Potrebujeme všetku pomoc, ktorú môžeme získať.

V druhej časti štúdie sa algoritmus učil predpovedať, čo objekt - domáce sitcom zošívačky ako diaľkové ovládače, riady a nádoby na odpadky - sa objaví na scéne o päť sekúnd neskôr. Napríklad, ak sú otvorené mikrovlnné dvierka, je relatívne veľká šanca, že sa objaví hrnček.

Ich algoritmus zatiaľ nie je dostatočne presný pre službu Google Glass, ale s spoluautorom Antonio Torralba, Ph.D. - financované z ceny výskumu Google fakulty a Vondrick s Google Ph.D. spoločenstvo - môžeme sa staviť, že sa tam dostane. Budúce verzie algoritmu, Vondrick predpovedá, môžu byť použité na programovanie robotov na interakciu s ľuďmi, alebo dokonca učiť bezpečnostné kamery na registráciu, keď osoba padá alebo sa zraní.

„Video nie je ako kniha„ Vyberte si vlastné dobrodružstvo “, kde môžete vidieť všetky potenciálne cesty,“ hovorí Vondrick. „Budúcnosť je vo svojej podstate nejednoznačná, takže je vzrušujúce vyzvať sa, aby sme vyvinuli systém, ktorý využíva tieto reprezentácie na predvídanie všetkých možností.“

$config[ads_kvadrat] not found