Princeton Undergrad vytvára Google Deep Dream-inšpiroval Deepjazz A.I. Hudobný tvorca

$config[ads_kvadrat] not found

Why Princeton University is Better than Harvard

Why Princeton University is Better than Harvard
Anonim

Ji-Sung Kim strávil skoré ranné hodiny prvého víkendu v apríli, ktorý bol spojený s kofeínom a kódovaním na svojom počítači, keď vyvinul deepjazz, hudobný generátor hlbokého učenia. Dvadsaťročný Princetonský počítačový vedecký odbor mal len 36 hodín na to, aby dokončil deepjazz počas svojho prvého hackathonu, HackPrinceton, ktorý sa uskutočnil 1. - 3. apríla na univerzite. Po dokončení maratónu kódovania vytvoril webovú stránku pre deepjazz a na zdrojovú adresu GitHubu uverejnil zdrojový kód.

Ale k Kimovmu prekvapeniu sa program vystrelil. Deepjazz sa neustále vyvíja na Python a GitHub - celkovo dosahuje najvyššie siedmy program na GitHub. To bolo dokonca vystupoval na titulnej stránke HackerNews a stále vytvára živú diskusiu.

„Nikdy som nečakal, že môj prvý projekt bude z hľadiska popularity touto výbušninou,“ hovorí Kim Inverzné. "Bolo to dosť šialené a zábavné."

deepjazz - Hlboké učenie jazzovej generácie pomocou Keras & Theano! http://t.co/G5wscglzO7 #python

- Python Trending (@pythonending) 11. apríl 2016

Medzi jedlom, spaním a dokončením iných kurzov Kim zdôvodnil, že mu trvalo asi 12 hodín, kým vyvinul zdrojový kód pre deepjazz. Avšak prišiel s myšlienkou na generátor umelej inteligencie dlho pred HackPrincetonom. Počas letnej stáže na Chicagskej univerzite narazil na Google Deep Dream, foto generátor, ktorý interpretuje vzory v obraze a transformuje ich na iné objekty, ktoré pozná. Výsledkom sú nevychované obrázky, ktoré vyzerajú ako keby vyšli divoký sen.

„Myšlienka používať hlboké učenie k interpretácii umenia bola pre mňa naozaj zaujímavá,“ hovorí Kim. „Tento druh rámca Deep Dream, ktorý spoločnosť Google predstavila a publikovala, bol naozaj fascinujúci, pretože vytvárate nové umelecké diela z existujúcich diel.“

Deepjazz využíva strojové učenie na generovanie jazzovej hudby - „A.I. postavený tak, aby jazz ”ako jeho SoundCloud profil uvádza. Kim, ktorý nebral hodiny hudobnej teórie, ale hral na klarinet sedem rokov, si vybral jazzovú hudbu kvôli svojim netradičným melódiám. A.I. „Môže mať nejaké nezvyčajné výstupy, takže si myslím, že jazz bol obzvlášť vhodný pre myšlienku generovania hudby za behu,“ hovorí.

On repurposed existujúci hudobný generátor optimalizovaný pre jazzovú hudbu, že jeho priateľ Evan Chow vyvinul s názvom JazzML, pomocou kódu získať relevantné dáta, ale transformovať ho do binárnej matice, ktorá je kompatibilná s dvoma hlboké učenie knižnice Keras a Theano.

Sám deepjazz je dvojvrstvovým LSTM, čo je druh umelej architektúry neurónovej siete, opisuje Kim. Potom, čo sa naučí počiatočnú základnú sekvenciu seminárov hudobných poznámok (Kim použil časti Pat Methenyho „And Then I Knew“), priradí pravdepodobnosť poznámkam a vygeneruje ďalšiu poznámku na základe týchto pravdepodobností. Ak napríklad program nakreslíte stupnicu A, B, C, je vysoká pravdepodobnosť, že ďalšia poznámka deepjazz bude generovaná D, vysvetľuje Kim.

Historicky kritici hovoria, že generátory hudby umelej inteligencie sú sužované produkciou piesní, ktoré znejú príliš roboticky a sterilne - chýba im farba počutá v hudbe skladanej ľuďmi. Jeffrey Bilmes, bývalý študent MIT, ktorý napísal prácu na počítačoch, ktoré reprodukujú hudobné rytmy v roku 1993, povedal obrátený v novembri:

„Keď sa učíte hrať hudbu a učíte sa hrať jazz, je tu intuitívne pochopenie toho, čo je to hudba, ktorá z nej robí človeka,“ povedal Bilmes. „Ľudia sú intuitívne bytosti a ľudia často nedokážu opísať, ako sú schopní robiť ľudské veci. V tej dobe som sa cítil, že možno som porušil posvätnú prísahu pri definovaní týchto vecí pre počítačové programy. “

Keď Kim robila výskum pre deepjazz, narazil na mnoho systémov, ktoré generovali hudbu, ktorá znela roboticky.

„Hudba a umenie sú veci, ktoré považujeme za hlboko ľudské,“ hovorí Kim. „Ak chcete, aby to znielo ľudskejšie a realistickejšie, je to naozaj ťažké kategorizovať.“ Kim navrhuje, aby generátory mohli vytvárať skladby, ktoré znejú ľudskejšie a naprogramovať ich tak, aby zneli menej ako pôvodná skladba.

Ostatní vývojári kontaktovali Kim a majú záujem o rozšírenie deepjazzu, aby s ním mohlo pracovať viac ľudí. Kim môže jedného dňa vidieť deepjazz, ktorý sa vyvinul do improvizačného partnera, ktorý umelo vygeneruje backtrack pre muzikanta, aby sa od neho odohral. Ešte ďalej do budúcnosti vidí aplikácie, ktoré vytvárajú nové, podobné znejúce hudobné súbory pre vaše obľúbené skladby alebo ktoré môžu navrhnúť nové akordy a progresy pre hudobníkov.

Kim pripúšťa, že je stále ďaleko od toho, aby bol odborníkom na hlboké učenie, ale jeho skúsenosti s vývojom hlbokého učenia a výcviku na stážach a Princetone mu priniesli cenný pohľad do tejto oblasti.

"Ad interim už nie je sci-fi sen. Je to niečo reálne a je to niečo, čo sa blíži veľmi rýchlym tempom, “hovorí Kim. „Dúfajme, že tento vysokoškolský študent, ktorý ešte nie je ešte vyšším študentom, bol schopný urobiť niečo v rámci hackatónu, je povzbudivý pre iných študentov, ktorí sa snažia dostať sa do počítačovej vedy.“

$config[ads_kvadrat] not found