Speechmatics používa AI na prepísanie jazykov, a je to biť Google

$config[ads_kvadrat] not found

What Does a Startup CEO Do: Roles and Responsibilities - Entrepreneur Life

What Does a Startup CEO Do: Roles and Responsibilities - Entrepreneur Life
Anonim

Speechmatika ide po spoločnosti Google. Britské spustenie sa minulý mesiac zbavilo Automatic Linguist, výkonnej umelej inteligencie, ktorá sa môže naučiť akýkoľvek jazyk na prepis z reči na text počas niekoľkých dní. Tím chce umožniť technológiu pre každý z približne 7000 jazykov na svete s potenciálom transformovať životy.

Od spustenia lingvistického nástroja, Speechmatics pracuje na Omniglot, výzve vybudovať jazyk denne. Minulý týždeň spoločnosť zaznamenala veľký míľnik: oficiálne porazila spoločnosť Google spolu s 72 jedinečnými jazykmi.

Systém využíva strojové učenie, aby zodpovedal audio dátam s prepisom transkriptu. Následne používa jazykové vzory z iných jazykov, aby bol proces čo najjednoduchší, čím sa identifikujú podobnosti medzi zvukmi a gramatickými štruktúrami a aplikujú sa na nové jazyky. Tento proces je vysoko efektívny: napríklad Speechmatics na Hindi trvalo len dva týždne na dosiahnutie 80% presnosti. Keď bol finálny produkt testovaný proti úsiliu spoločnosti Google, urobil o 23 percent menej chýb.

obrátený hovoril s Benedikt von Thüngen, generálnym riaditeľom spoločnosti Speechmatics, aby sa dozvedel viac.

Ako ste začali pracovať na projekte?

Založili sme projekt Omniglot ako výzvu pre nás - zistiť, koľko jazykov budeme schopní vybudovať za šesť týždňov. Chvíľu sme si uvedomili, že tradičný prístup k budovaniu každého jazyka už nie je životaschopný, keď sa snažíme rýchlo škálovať. Vzhľadom na túto skutočnosť sme museli prehodnotiť, aký jazyk je, ako je štruktúrovaný a aké sú podobnosti medzi rôznymi jazykmi. Našli sme spôsob, ako využiť tieto spoločné rysy na identifikáciu vzorov a pomôcť nášmu AI-powered framework, Automatic Linguist (AL), aby jazyky boli rýchlejšie ako kedykoľvek predtým - 46 v šiestich týždňoch, aby boli presné, alebo o jednom jazyku denne počas šiestich týždňov !

Ako sa líši od úsilia spoločnosti Google?

Náš prístup k budovaniu jazykov je jedným z hlavných aspektov, ktorý nás odlišuje od spoločnosti Google. Aj keď predpokladáme, že si budujú svoje jazyky individuálne (alebo tým, čo nazývame hrubou silou), využívame silu A.I. zjednodušiť a urýchliť proces vytvárania jazyka. Okrem toho, zatiaľ čo iné služby, ako napríklad Google, sa zameriavajú skôr na budovanie dialektov než na jedinečné jazyky, sme hrdí na to, že môžeme povedať, že naše úsilie bolo zamerané na jedinečné jazyky z celého sveta, vrátane oblastí, ktoré už predtým veľké spoločnosti zaoberajúce sa technológiami nepodceňovali.

Aké sú pre to niektoré aplikácie v reálnom svete?

Teraz máme k dispozícii technológie a vedomosti, aby naše služby boli ďalekosiahlejšie ako kedykoľvek predtým, a prinášajú automatické rozpoznávanie reči (ASR) všetkým. Toto je obzvlášť dôležité v krajinách s nízkou mierou gramotnosti, kde schopnosť používať predtým nedostupnú technológiu na komunikáciu s rečou na text môže pre ľudí znamenať rozdiel. Ďalšie reálne prípady, keď technológia ASR môže pomôcť s problémami prístupnosti - ľudia so sluchovým a / alebo zrakovým postihnutím z celého sveta, môžu teraz používať zariadenie tak jednoduché ako telefón na interakciu s ľuďmi okolo nich.

Zlepšuje sa tým presnosť správnych jazykov, ako je angličtina?

Ako sme naďalej rozvíjať viac jazykov, naše A.I. rámec bude čoraz viac zdokonaľovaný pri určovaní jazykových znakov a vzorov. Tieto vedomosti využijeme na ďalšie zdokonalenie našej súčasnej jazykovej základne vrátane angličtiny.

Mohlo by to zlepšiť prekladateľské nástroje v reálnom čase od spoločnosti Google Pixel Buds?

Určite vidíme projekty ako Omniglot, ktoré pomáhajú zlepšiť prekladateľské nástroje v reálnom čase. Keďže viac prostriedkov sa investuje do rozširovania dosahu a presnosti jazykov, v sektore prekladateľských služieb budeme svedkami neustáleho zlepšovania.

Pracuje táto práca s akýmkoľvek jazykom, dokonca aj s jazykmi ako Klingon?

Napriek tomu sme sa pokúsili vybudovať nejaké spojenia, ale nevidíme žiadne dôvody, prečo by nefungovali. Keďže tieto jazyky stále hovoria ľudia, dodržiavajú aj podobné štrukturálne pravidlá a obmedzenia ako bežné jazyky (ako napríklad počet fonémov), ktoré by poskytli AL dostatok údajov pre zostavenie.

Otvorili ste projekt?

Nie, na to nemáme plány.

Ako bude fungovať licencovanie?

Jazyky ponúkané v rámci projektu Omniglot sú bezplatné a nemôžu byť použité na komerčné účely. V takom prípade nebude v dohľadnej budúcnosti k nim pripojené žiadne povolenie.

Aké sú ďalšie kroky?

Projekt Omniglot je pre nás len začiatok. Chceme nakoniec vybudovať každý jazyk na svete, a preto budeme usilovne pracovať na tomto cieli!

$config[ads_kvadrat] not found