MIT lingvisti hovoria, že ľudské jazyky môžu byť predvídateľné

$config[ads_kvadrat] not found

Лингвистика как наука / Что я знаю

Лингвистика как наука / Что я знаю
Anonim

Univerzálny prekladateľ je štandardný sci-fi trope: Ryba babel existuje v mnohých formách (myslím: C-3P0, Gibsonove „Microsofty“ a matica linguacode). IRL lingvisti už dlho uvažovali o vytvorení tejto technológie ako o hlavnom puzzle a o druhu koncovky praskania kódu. Výskumníci z Massachusetts Institute of Technology teraz oznámili, že objavili takmer univerzálny majetok v 37 jazykoch. Tento model, ktorý sa nazýva „Minimalizácia dĺžky závislostí“, označuje nielen základnú ľudskú logiku pod zložitým jazykom, ale aj potenciál vytvárať a obnovovať nálady z podobných častí.

DLM je v podstate myšlienka, že podstatné mená sa približujú k prídavným menám, pretože je ľahšie držať si myšlienku tehlového domu vo vašej hlave, ak sa „tehla“ a „dom“ postavia zblízka. (Texty, „Je to tehlový dom,“ je oveľa viac nezabudnuteľný ako text, „Brick je materiál, ktorý by ste použili na vytvorenie domu.“) V tlačovej správe MIT ponúka tento príklad:

(1) „John vyhodil starý odpad, ktorý sedel v kuchyni.“

(2) „John hodil starý odpad do kuchyne.“

Prvá veta je ľahšie čitateľná, pretože medzi hádzanými a vonku nie je veľa slov. A čím dlhšia je veta, tým dôležitejšie je zmenšiť dĺžku závislosti, aby sa zabezpečil zmysel. Jadrom novej štúdie, napíšte autorov, je, že ukázali, že „celkové dĺžky závislostí pre všetky jazyky sú kratšie ako konzervatívne náhodné základné línie“.

Že my všetci zdieľame základné jazykové pravidlá je myšlienka, ktorá bola na chvíľu kopaná, ale nikto ju nevykopal s takou chuťou ako Noam Chomsky, takzvaný radikálny lingvista, ktorý popisuje štruktúru ľudského jazyka ako zázrak alebo systém, (Spoiler: Neverí na zázraky.) Na svojej webovej stránke Chomsky zobrazuje myšlienku univerzálnej gramatiky takto:

Myslím si, že najdôležitejšia práca, ktorá sa deje, súvisí s hľadaním veľmi všeobecných a abstraktných vlastností toho, čo sa niekedy nazýva univerzálna gramatika: všeobecné vlastnosti jazyka, ktoré odrážajú skôr biologickú nevyhnutnosť než logickú nevyhnutnosť; to znamená vlastnosti jazyka, ktoré nie sú logicky nevyhnutné pre takýto systém, ale sú základnými invariantnými vlastnosťami ľudského jazyka a sú známe bez učenia. Poznáme tieto vlastnosti, ale nepoznáme ich. Naše vedomosti o týchto vlastnostiach jednoducho využívame ako základ pre učenie.

Táto štúdia MIT nie je prvou minimálnou závislosťou na dĺžke. Jazykovedec z University of Edinburgh Jennifer Culbertsonová, ktorá sa nezúčastnila na štúdii, povedala Ars Technica, že DLM je silným prípadom založeným na ťažko dostupných údajoch (t. J. Databáze 37 jazykov, ktoré sa dajú analyzovať).

$config[ads_kvadrat] not found