發布者:|TIME : 2017-08-29
摘要: 從藝術(shù)的角度來(lái)講,神經網絡遷移隻不過是另一種“印刷術(shù)”,過去的印刷術(shù)是在複制(zhì)圖像,而神經網絡遷移是在複制(zhì)風格。
神經風格遷移算(suàn)法學作(zuò)畫(huà),人(rén)類會(huì)在藝術(shù)領域敗給人(rén)工智能嗎?
随着人(rén)工智能越來(lái)越全能,TA們似乎已經能接替我們完成一切工作(zuò),或許未來(lái)真的像某位大(dà)佬說的一樣,人(rén)類隻負責研究藝術(shù)和(hé)哲學。
不過目前看來(lái),藝術(shù)這塊陣地也快要失守了。
神經風格遷移算(suàn)法學作(zuò)畫(huà),人(rén)類會(huì)在藝術(shù)領域敗給人(rén)工智能嗎?
用過Prisma的應該都知道(dào),把照片變成名畫(huà)風格如今隻是動動手指的事情。事實上(shàng),隻要有(yǒu)一兩張樣本,神經網絡可(kě)以迅速的學會(huì)各種風格,這種技(jì)術(shù)被稱為(wèi)“神經風格遷移”。
如何實現神經風格遷移?
卷積神經網絡将圖像分割為(wèi)“內(nèi)容”和(hé)“風格”,在抓取時(shí),高(gāo)層神經網絡抓取了圖片的風格,比如色彩和(hé)排列。而底層神經網絡抓取的則是圖像的內(nèi)容,也就是圖像的細節。
這隻是神經風格遷移的第一步,在抓取了風格之後,還(hái)要将風格叠代到需要改變的圖片上(shàng)。
風格叠代通(tōng)常有(yǒu)兩種方式,一種基于圖片,直接更新叠代圖片像素,最終實現風格的遷移。很(hěn)多(duō)算(suàn)法會(huì)在過程中計(jì)算(suàn)最大(dà)均值差,測量風格圖像和(hé)內(nèi)容圖像之間(jiān)的差異。讓兩種圖像“對齊”,從而減少(shǎo)圖像叠代時(shí)造成的損失和(hé)誤差。
另一種則是基于模型叠代的,當需要用某一種風格叠代大(dà)量圖像時(shí),可(kě)以訓練前饋網絡,使用梯度下降,通(tōng)過叠代式地更新模型來(lái)優化網絡模型。
神經風格遷移應用,不僅僅是畫(huà)作(zuò)
如果你(nǐ)認為(wèi)神經風格遷移隻是一個(gè)升級版的photoshop濾鏡,那(nà)就大(dà)錯特錯了,很(hěn)多(duō)案例表明(míng),這一技(jì)術(shù)正在被應用于越來(lái)越多(duō)的領域之上(shàng)。
比如Flipboard軟件工程師(shī)曾經發布過一個(gè)将神經風格遷移應用在漢字字體(tǐ)上(shàng)的項目。
神經風格遷移算(suàn)法學作(zuò)畫(huà),人(rén)類會(huì)在藝術(shù)領域敗給人(rén)工智能嗎?
提供2000個(gè)左右的樣本字體(tǐ),讓神經網絡識别出偏旁部件和(hé)筆觸風格的區(qū)别,最終就能實現出字體(tǐ)之間(jiān)的轉化。
又比如在暮光之城女主角克裏斯汀·斯圖爾特拍攝的電(diàn)影(yǐng)《Come swim》中,也利用了神經風格遷移技(jì)術(shù)将印象派繪畫(huà)風格和(hé)電(diàn)影(yǐng)畫(huà)面相融合。就此,克裏斯汀還(hái)寫了一篇題為(wèi)“運用神經風格轉移實現印象派風格之在電(diàn)影(yǐng)“Come Swim”中的應用”的論文。
神經風格遷移算(suàn)法學作(zuò)畫(huà),人(rén)類會(huì)在藝術(shù)領域敗給人(rén)工智能嗎?
如上(shàng)圖一樣,從畫(huà)作(zuò)中提取風格,再通(tōng)過算(suàn)法叠代渲染到畫(huà)面之上(shàng)。不過在論文中基本沒有(yǒu)提到成本,尤其是時(shí)間(jiān)成本問題。《Come swim》中的情節是一半現實(未經處理(lǐ)過的畫(huà)面)和(hé)一半夢境(經由神經風格遷移處理(lǐ)過的畫(huà)面)。從拍攝上(shàng)來(lái)說自然是直接渲染更加方便,如果是完全的動畫(huà)電(diàn)影(yǐng),這種先拍攝再渲染的方式是否比直接電(diàn)腦(nǎo)繪制(zhì)更有(yǒu)性價比還(hái)值得(de)商榷。
神經風格遷移真的能“替代”藝術(shù)嗎?
其實說了這麽多(duō),多(duō)少(shǎo)有(yǒu)點聳人(rén)聽(tīng)聞的嫌疑。從藝術(shù)的角度來(lái)講,神經網絡遷移隻不過是另一種“印刷術(shù)”,過去的印刷術(shù)是在複制(zhì)圖像,而神經網絡遷移是在複制(zhì)風格。
而且神經網絡遷移是沒有(yǒu)“創作(zuò)”能力的,如果不給TA需叠代的圖像內(nèi)容,TA隻能産出一些(xiē)無意義的、混亂的像素點。雖然目前有(yǒu)人(rén)利用圖像語義布局技(jì)術(shù)讓AI創造出全新的畫(huà)面,但(dàn)對于AI來(lái)說,這隻是一種模仿,在創造時(shí)沒有(yǒu)付諸情感,可(kě)能和(hé)我們定義中的藝術(shù)還(hái)有(yǒu)着不小(xiǎo)的差距。
神經風格遷移算(suàn)法學作(zuò)畫(huà),人(rén)類會(huì)在藝術(shù)領域敗給人(rén)工智能嗎?
(作(zuò)畫(huà)機器(qì)人(rén))
可(kě)神經風格遷移能做(zuò)到的,卻是在藝術(shù)商業化過程中為(wèi)人(rén)們節約大(dà)量的時(shí)間(jiān)。
比如在字體(tǐ)項目中,藝術(shù)創作(zuò)者隻需創造少(shǎo)量字的字體(tǐ),機器(qì)則負責完成剩下的工作(zuò)。又比如以《Cool swim》為(wèi)代表的影(yǐng)視(shì)後期工作(zuò),隻需要幾張畫(huà)作(zuò)确立風格,就能完成對整部電(diàn)影(yǐng)的渲染。
目前看來(lái),神經風格遷移最适合應用在動畫(huà)産業上(shàng)。比如新海誠的作(zuò)品,就是出了名的和(hé)實景高(gāo)度相似,色彩風格顯著。之前還(hái)有(yǒu)照片後期産品推出過新海誠風格的濾鏡,和(hé)風景照結合,和(hé)動畫(huà)中的畫(huà)面非常相似。而神經網絡遷移,則可(kě)以更好的完成這項工作(zuò)。包括對動畫(huà)原稿的上(shàng)色等等,都能極大(dà)的提高(gāo)産業工作(zuò)效率。
這也給藝術(shù)創作(zuò)提出了一個(gè)全新的問題,我們是否應該為(wèi)“風格”設立所有(yǒu)權?畢竟利用神經網絡遷移,人(rén)人(rén)都可(kě)以以假亂真的模仿梵高(gāo)。如果一副畫(huà)作(zuò)由我原創,卻經由他人(rén)風格叠代處理(lǐ),那(nà)這幅畫(huà)的作(zuò)者究竟應該是我還(hái)是别人(rén),又或者該屬于算(suàn)法的開(kāi)發者?在模仿的成本極低(dī)時(shí),又該如何為(wèi)模仿和(hé)抄襲劃分界限?
當然,這些(xiē)都是後話(huà)。科技(jì)的發展,除了為(wèi)人(rén)類生(shēng)活帶來(lái)便利之外,還(hái)在不斷刷新着我們對各種事物的定義。像是一百年前我們認為(wèi)藝術(shù)隻能誕生(shēng)于畫(huà)布和(hé)顔料中,而如今數(shù)位闆、Photoshop都是創造藝術(shù)的工具。人(rén)工智能不會(huì)從人(rén)類手中奪走創作(zuò)權,更不會(huì)“消滅”藝術(shù),隻會(huì)将這項美妙的事業帶上(shàng)更高(gāo)的境界。
(廈門(mén)網站(zhàn)建設文章來(lái)自百度新聞)
聯系地址:廈門(mén)市軟件園二期望海路23号之二204|A3~A5
電(diàn)話(huà):0592-5786385
傳真:0592-5786385
QQ:413141903