Čo sa stane, keď sa rozpoznávanie tváre používa na vtákoch? Veda vysvetľuje

$config[ads_kvadrat] not found

Вилейанур Рамачандран (Vilayanur Ramachandran) о твоём разуме

Вилейанур Рамачандран (Vilayanur Ramachandran) о твоём разуме

Obsah:

Anonim

Ako birder som počul, že ak by ste venovali veľkú pozornosť hlavnému peru na ďasnatých ďatloch, ktoré navštívili vaše krmítka pre vtáky, mohli by ste rozoznať jednotlivé vtáky. Toto ma zaujalo. Dokonca som išiel tak ďaleko, že som sa pokúsil načrtnúť vtáky na svoje vlastné krmítka a zistil som, že je to pravda, až do bodu.

Medzičasom, v mojej práci ako počítačový vedec, som vedel, že iní výskumníci používali techniky strojového učenia na rozpoznanie jednotlivých tvárí v digitálnych obrazoch s vysokým stupňom presnosti.

Tieto projekty ma premýšľali o spôsoboch, ako spojiť môj koníček s mojou každodennou prácou. Bolo by možné použiť tieto techniky na identifikáciu jednotlivých vtákov?

Tak som vybudoval nástroj na zber údajov: typ vtáčieho krmítka, ktorý uprednostňujú ďatle a kameru aktivovanú pohybom. Nastavil som svoju monitorovaciu stanicu v mojom prímestskom dvore Virginia a čakal, kým sa vtáky neobjavia.

Klasifikácia obrazu

Klasifikácia obrázkov je horúcou témou v technologickom svete. Veľké spoločnosti ako Facebook, Apple a Google aktívne skúmajú tento problém, aby poskytli služby, ako je vizuálne vyhľadávanie, automatické označovanie priateľov v príspevkoch v sociálnych médiách a schopnosť používať tvár na odomknutie mobilu. Orgány činné v trestnom konaní sa tiež veľmi zaujímajú, predovšetkým o rozpoznanie tvárí v digitálnych snímkach.

Keď som začal pracovať s mojimi študentmi na tomto projekte, výskum klasifikácie obrázkov sa zameral na techniku, ktorá sa pozerala na obrazové prvky, ako sú hrany, rohy a oblasti podobnej farby. To sú často kúsky, ktoré by mohli byť zostavené do nejakého rozpoznateľného objektu. Tieto prístupy boli približne o 70% presné, s použitím referenčných súborov údajov so stovkami kategórií a desiatkami tisíc príkladov vzdelávania.

Nedávny výskum sa posunul smerom k použitiu umelých neurónových sietí, ktoré identifikujú ich vlastné črty, ktoré sa ukázali ako najužitočnejšie pre presnú klasifikáciu. Neurónové siete sú modelované veľmi voľne na vzore komunikácie medzi neurónmi v ľudskom mozgu. Konvolučné neurónové siete, typ, ktorý teraz používame v našej práci s vtákmi, sú modifikované spôsobmi, ktoré boli modelované na vizuálnej kôre. To ich robí obzvlášť vhodnými pre problémy klasifikácie obrázkov.

Niektorí iní výskumníci už vyskúšali podobné techniky na zvieratách. Inšpiroval ma čiastočne počítačová vedkyňa Andrea Danyluk z Williams College, ktorá použila strojové učenie na identifikáciu jednotlivých bodkovaných mlokovníkov. Funguje to preto, že každý mlok má charakteristický vzor škvŕn.

Pokrok v oblasti ID vtákov

Zatiaľ čo moji študenti a ja sme nemali takmer toľko obrázkov, s ktorými by sme mohli pracovať ako väčšina iných výskumných pracovníkov a spoločností, mali sme výhodu niektorých obmedzení, ktoré by mohli zvýšiť presnosť nášho klasifikátora.

Všetky naše obrazy boli prevzaté z tej istej perspektívy, mali rovnaký rozsah a spadali do obmedzeného počtu kategórií. Všetko, čo bolo povedané, len 15 druhov niekedy navštívil feeder v mojej oblasti. Z nich iba 10 navštívilo dosť často na to, aby poskytlo užitočný základ pre školenie klasifikátora.

Obmedzený počet snímok bol jednoznačným hendikepom, ale malý počet kategórií pracoval v náš prospech. Keď došlo k poznaniu, či vták v obraze bol chickadee, Carolina wren, kardinál alebo niečo iné, raný projekt založený na algoritme rozpoznávania tváre dosiahol asi 85% presnosť - dosť dobrý, aby nás zaujímal problém.

Identifikácia vtákov v obrazoch je príkladom úlohy „jemnozrnnej klasifikácie“, čo znamená, že algoritmus sa pokúša rozlišovať medzi objektmi, ktoré sa od seba navzájom mierne líšia. Mnohé vtáky, ktoré sa objavujú na krmivách, majú približne rovnaký tvar, napríklad rozprávanie rozdielu medzi jednotlivými druhmi môže byť dosť náročné aj pre skúsených pozorovateľov.

Výzva len narastá, keď sa pokúsite identifikovať jednotlivcov. Pre väčšinu druhov to jednoducho nie je možné. Ďateliny, o ktoré som sa zaujímal, majú silne vzorované perie, ale stále sú vo veľkej miere podobné od jednotlivca k jednotlivcovi.

Takže jednou z našich najväčších výziev bola ľudská úloha označovania údajov na školenie nášho klasifikátora. Zistil som, že hlavové perie ďatlíkov nie sú spoľahlivým spôsobom, ako rozlišovať medzi jednotlivcami, pretože tieto perie sa pohybujú veľmi veľa. Používajú ich vtáky na vyjadrenie podráždenia alebo poplachu. Avšak vzory škvŕn na zložených krídlach sú viac konzistentné a zdalo sa, že fungujú v pohode, aby si to jeden od druhého povedali. Tieto krídlové perá boli takmer vždy viditeľné na našich obrazoch, zatiaľ čo vzory hlavy mohli byť zakryté v závislosti na uhle vtáčej hlavy.

Na konci sme mali 2 450 obrázkov ôsmich rôznych ďatlí. Pri identifikácii jednotlivých ďatľov dosiahli naše experimenty 97% presnosť. Tento výsledok však vyžaduje ďalšie overenie.

Ako to môže pomôcť vtákov?

Ornitológovia potrebujú presné údaje o tom, ako sa menia populácie vtákov v čase. Vzhľadom na to, že mnohé druhy sú veľmi špecifické pre potreby biotopov, pokiaľ ide o chov, zimovanie a migráciu, jemnozrnné údaje by mohli byť užitočné na premýšľanie o účinkoch meniacej sa krajiny. Údaje o jednotlivých druhoch, ako sú ďateliny, by sa potom mohli zhodovať s inými informáciami, ako sú mapy využitia územia, modely počasia, rast ľudskej populácie a tak ďalej, aby sa lepšie pochopilo množstvo miestnych druhov v čase.

Domnievam sa, že poloautomatická monitorovacia stanica je v dosahu za skromné ​​náklady. Moja monitorovacia stanica stála okolo 500 USD. Nedávne štúdie naznačujú, že by malo byť možné trénovať klasifikátora pomocou oveľa širšej skupiny obrázkov, potom ho doladiť rýchlo a s primeranými výpočtovými požiadavkami na rozpoznanie jednotlivých vtákov.

Projekty ako eBird Cornell Laboratory of ornithology eBird postavili malú armádu občianskych vedcov do praxe na monitorovanie dynamiky populácie, ale väčšina týchto údajov má tendenciu byť skôr z miest, kde sú početné osoby, a nie z miest, ktoré majú osobitný význam pre vedcov.

Prístup automatizovanej monitorovacej stanice by mohol poskytnúť multiplikátor sily pre biológov žijúcich vo voľnej prírode, ktorí sa zaoberajú špecifickými druhmi alebo špecifickými miestami. Tým by sa rozšírila ich schopnosť zbierať údaje s minimálnym zásahom človeka.

Tento článok bol pôvodne publikovaný na The Conversation od Lewis Barnett. Prečítajte si pôvodný článok.

$config[ads_kvadrat] not found