Pochopenie prirodzeného jazyka je budúcnosťou A.I. Rozpoznávanie hlasu

$config[ads_kvadrat] not found
Anonim

S príchodom konzistentnej kapacity spoločnosti Amazon Alexa a Siri, ktorá je schopná prevziať viac úloh (a získať viac a viac sassy), sa mnohí pýtajú: čo je ďalej pre pochopenie prirodzeného jazyka a konverzačné hlasové rozhrania?

Existuje niekoľko spoločností, krk a krk v tomto závode. Je tu Wit.ai, spoločnosť Facebook, ktorú ste získali. (Skúste tento príkaz: „Chcem sledovať mačky.“) Apple má svoj HomeKit a spolu s ním robí to, čo robí Apple najlepšie - kopať zadok. Amazon je tiež vpredu so svojimi Echo a Echo Dot vybavenými Alexa.

MindMeld je jedna spoločnosť, ktorá je na stope pochopenia prirodzeného jazyka. MindMeld poskytuje svoje schopnosti porozumieť prirodzenému jazyku aj iným spoločnostiam, ktoré sa snažia pridať inteligentné hlasové rozhrania k svojim produktom, službám alebo zariadeniam. Spoločnosť so sídlom v San Franciscu poskytuje partnerom infraštruktúru a možnosti prispôsobenia tak, aby ich zariadenia mohli mať svojich vlastných, doladených osobných asistentov. MindMeld nedávno oznámil takéto partnerstvo so spoločnosťou Spotify, ale spolupracuje aj s automobilovými spoločnosťami, obrannými agentúrami, spoločnosťami elektronického obchodu a ďalšími. (A samozrejme nie je schopný zdieľať mnohé špecifiká takýchto partnerstiev.)

obrátený Hovoril so Sam Vasishtom o stave hlasového rozpoznávania hlasu MindMeldu - ale rýchlo zistil, že „rozpoznávanie hlasu“ ako podniku je teraz „svetskou témou“. V týchto dňoch je to všetko o „pochopení prirodzeného jazyka. „Rozpoznávanie hlasu takmer dosiahlo svoj zenit: po 50-tich rokoch vývoja môžu AI rozpoznať reč. Tieto systémy sú v práci takmer lepšie ako ľudia a čoskoro predbehnú obyčajných smrteľníkov.

Ďalším predvídateľným krokom, potom - podobne ako vývoj dieťaťa - je naučiť tieto systémy rozumieť jazyk, ktorý teraz poznajú. „Tento človek hovorí slovami; toto sú slová „je ďaleko od toho,“ chápem, čo tento človek hovorí; dovoľte mi pomôcť. “

A tento ďalší krok a vývoj si vyžaduje interpretáciu zmysel Imitácia spôsobu, akým ľudská myseľ spracúva verbálne informácie. Táto rovnica má dve časti. Prvým je zámer: Aký je cieľ človeka alebo jeho túžba hovoriť túto vetu? Počítač, ktorý dokáže extrahovať zámer z hovorenej vety, môže „pochopiť“, čo chce človek ovplyvniť X alebo komunikovať y, Prepletené s týmto procesom je druhá časť rovnice: Entity. A.I. musí vedieť, ako určiť subjekt, ktorý je adresovaný, predmet zámeru človeka.

MindMeld nie je (ako som predpokladal alebo dúfal), že zamestnáva filozofov. Zamestnáva expertov na prirodzený jazyk, ale veľa z A.I. Proces „učenia“ je sám o sebe relatívne praktický. Ak vyučujete systém na pochopenie objednávok kávy, musíte systému ukázať rôzne spôsoby, ako si ľudia môžu objednať kávu.

"Mám rád mochu."

"Mohol by som si dať šálku joe?"

"Len veľká káva pre mňa."

A tam prichádzajú odborníci z oblasti prirodzeného jazyka - lingvisti - ale to už nie je potrebné, pretože môžeme tieto údaje zaplniť. Tieto nástroje vám umožňujú klásť tisícom ľudí rovnakú otázku a zostavovať ich odpovede. Potom len tieto odpovede vložíte do A.I., a voila: A.I. reagovať na širokú škálu možných otázok. „Z tisícov dotazov môžeme teraz len v podstate naučiť stroj, ako by mohli vzniknúť miliardy ďalších dopytov,“ hovorí Vasisht.

obrátený spýtal sa Vasisht, ktorý je už dlho zasvätený v A.I. a pochopenie prirodzeného jazyka, špekulácia pre nás.

Môže sa MindMeld zúčastniť rozšíreného dialógu? Ak napríklad požiadam o následnú otázku, bude A.I. pochopiť a reagovať?

Áno. To je súčasťou dizajnu. Ak niekto položí otázku, ktorá je neúplná - tak napríklad, ak si objednám kávu, a nešpecifikujem veľkosť kávy, ktorú chcem, vráti sa a povie: „Aká je vaša káva chceš?"

Očakávate nejaký pokrok v teste Turing?

Myslím, že sme s tým dosť blízko. IBM Watson to urobil Jeopardy! a myslím si, že to bol naozaj dobrý príklad. Sme v tomto bode: Je to veľmi blízko. Tak ako teraz, pokiaľ ide o rozpoznávanie reči, sme v bode, keď sú stroje rovnako dobré ako ľudské bytosti, myslím, že budeme - určite v najbližších troch až piatich rokoch - v bode, kde väčšina týchto konverzačných hlasov systémy sa budú považovať za také dobré ako ľudia.

Čo robí MindMeld?

Môžeme použiť našu technológiu na akýkoľvek druh produktu, akýkoľvek druh služby, akékoľvek dátové domény. Jednou z nich je aj domáca automatizácia. V domácnosti máte ovládanie osvetlenia, termostat, bezpečnostné systémy, audio systémy, video systémy, všetky tieto veci. Sme schopní kontrolovať ktorýkoľvek zo systémov za predpokladu, že existuje vhodné rozhranie.

Čo si prajete, aby ste sa pripojili k MindMeld vo svojom vlastnom dome?

Myslím si, že pokročilejšie prípady použitia - ako napríklad rozprávanie s mojím Spotify, aby som povedal: „Prehraj mi playlist Rolling Stones“, alebo „Večer si zahrajte klasickú hudbu“ - tieto veci by boli … úžasné.

Čokoľvek, čo by bolo neočakávanejšie, alebo ktoré by ste chceli ovládať svojím hlasom?

Veci, ktoré som ti opísal, sú veci, o ktorých si myslím, že sú hroziace. Inými slovami, tieto sa budú diať veľmi skoro. Myslím, že to, čo sa nestane hneď, by boli veci ako mikrovlnné rúry, kávovary a chladničky. S týmito druhmi spotrebičov je možné kontrolovať - ​​takže v podstate môžem povedať: „Je môj kávovar pripravený na prípravu kávy? Zapnite kávovar a ak nebol pripravený, mal by sa vrátiť a povedať: „Je mi ľúto, ale váš kávovar nie je pripravený“ - tento druh inteligencie ešte neexistuje. To bude svätý grál: Tam, kde v podstate každé zariadenie môže hovoriť späť k vám a povedať vám, čo to môže a čo nemôže urobiť. Ale ešte nie sme tam.

Čo si myslíte, že drží priemysel späť?

Teraz sú to veľmi lacné zariadenia. Ide o spotrebiče, ktoré si môžete kúpiť takmer za nič. Pred desiatimi rokmi stoja oveľa viac.Budovanie nových funkcií je teda niečo, čo zvyšuje náklady na tieto zariadenia. V konečnom dôsledku je hodnota aktuálnej hodnoty veľmi silná; Väčšina z týchto výrobcov nemá sklon pridávať nové funkcie, pokiaľ nie sú na veľmi nízkej úrovni nákladov.

Myslím si, že je to jeden aspekt. Ďalším aspektom je, že hovoríme o pripojení týchto zariadení. Na pripojenie týchto zariadení musí byť viac ako len hlasový prípad. Musí existovať viac schopností, ktoré potrebujú jazdiť na tomto spojení predtým, než sa stanú životaschopnými.

Viete o akejkoľvek spoločnosti, ktorá pracuje na tejto kapacite?

Veľa polovodičových spoločností pracuje na veľmi lacných mikrofónnych poliach. Druh, ktorý môžete v podstate vložiť - pri veľmi nízkych nákladoch, do takmer akéhokoľvek zariadenia alebo aplikácie - ktoré by umožnili hlasový vstup. A nemusíte stáť vedľa týchto zariadení - môžete hovoriť od 10 metrov. Budovanie tejto schopnosti - myslím, že je to východiskový bod. A myslím, že to umožní ľuďom, aby začali používať mikrofóny na zariadeniach, a potom budú nasledovať ďalšie pokročilé možnosti. Ale hneď teraz nepoznám žiadnu spoločnosť, ktorá buduje tento druh inteligentného kávovaru alebo inteligentnej mikrovlnnej rúry alebo práčky.

Aký je váš najlepší odhad, keď máme plne inteligentné domy, plne inteligentné apartmány?

Dnes máme v skutočnosti takmer všetky základné podsystémy v dome, ktoré ľudia chcú automatizovať, ktoré sú schopné automatizácie. Patria sem svetlá, termostaty, bezpečnostné systémy, garážové vráta, zámky predných dverí - také veci. Všetky tieto veci sa dajú urobiť. Problém je naozaj okolo cenových bodov. Tie sú stále v cenovej situácii, kde sú to hlavne prví osvojovatelia a ľudia, ktorí ich naozaj potrebujú. Ale cenové body na tieto veci dramaticky klesajú, veľmi rýchlo. Myslím, že v nasledujúcich rokoch pravdepodobne tieto subsystémy dostaneme na masový trh.

O ďalších veciach, o ktorých som hovoril - o automatizácii veľmi lacných spotrebičov - si myslím, že sú to pravdepodobne v časovom rámci päť až sedem rokov. Viac ako 10 rokov, predtým, než sa stanú skutočnosťou. Ale, ako som už povedal, to sú veci, ktoré budú vyžadovať množstvo ďalších vecí, ktoré sa majú stretnúť. A mohlo by sa to stať skôr, ak sa tieto rôzne zložky spoja skôr.

Čo si myslíte, že by apartmán v New Yorku alebo San Franciscu vyzeral v roku 2050?

2050! Wow. Myslím, že tam budeme úplne. Taký druh vecí, ktoré vidíme vo vedeckých hraných filmoch - kde môžete do veľkej miery hovoriť s každým systémom vo vašom dome a ovládať všetko hlasom - myslím si, že tieto druhy schopností budú rozšírené. Určite v mestách ako New York a San Francisco.

$config[ads_kvadrat] not found