Výskum spoločnosti Microsoft prináša lepšie rozpoznávanie reči

$config[ads_kvadrat] not found
Anonim

Spoločnosť Microsoft sa stala prvou spoločnosťou na svete, ktorá vyvinula softvér na rozpoznávanie reči, ktorý je presnejší ako ľudia. V dokumente „Dosiahnutie ľudskej parity v rozhovore s rozhovorom s rečou“, ktorý bol publikovaný v pondelok, softvér vytvoril prepisy, ktoré obsahovali o polovicu menej chýb ako ľudské úsilie, čo je neuveriteľné vzhľadom na to, ako sú dobrí ľudia pri porozumení reči. Prielom otvára dvere pre nové A.I. asistentov, ktorí sú presnejší ako kedykoľvek predtým.

Je pôsobivé, ako ďaleko sa technológia dostala v takom krátkom čase. Nebolo to tak dávno, čo počítačové rozpoznávanie reči bolo zvláštnym výklenkom, ktorý sa zdal beznádejne vzdialený. Pozrite si ukážku rečového softvéru Windows Vista od roku 2006:

Tím použil test National Institute of Standards and Technology (NIST) 2000, ktorý sa používa v celom priemysle na meranie spoľahlivosti prepisov reči. Konverzácia prebieha medzi dvoma účastníkmi po telefóne, potom sa otočí, potom sa porovná výsledný skript a overí sa oproti pravopisu slovníka.

V časti ústredne, kde po prvýkrát hovoria dvaja cudzinci, je miera chybovosti ľudí okolo 5,9%, zatiaľ čo na domácej strane, kde sa hovoria dvaja ľudia, ktorí sa navzájom poznajú, je chybovosť okolo 11,3%. Softvér od spoločnosti Microsoft zaznamenal o 0,4% nižšiu chybovosť.

Prielom pomôže priniesť nové formy pohlcujúcej A.I.. V auguste, študent Joshua Browder vzal zábaly z jeho DoNotPay chatbot, ktorý môže pomôcť bezdomovcom získať bezplatné právne poradenstvo. V kombinácii s pokrokom v oblasti rozpoznávania je ľahké predstaviť si budúcnosť, kde sa ľudia pýtajú virtuálneho asistenta na pomoc s bývaním pravidelným rozhovorom s počítačom.

V tejto fáze výskumníci uvažujú o tom, ako môže rozpoznávanie hlasu na báze A.I. Sensay, detegujúci AI. z laboratória za Siri využíva pokročilé schopnosti rozpoznávania, aby zistil, či sa užívateľ cíti nahnevaný alebo zmätený, pričom mení svoje odpovede tak, aby vyhovovali situácii. Odstránenie bariéry rozpoznávania hlasu náchylného na chyby vytvára nové vzrušujúce príležitosti pre virtuálnu pomoc.

$config[ads_kvadrat] not found