
你應該還記得幾個月前把涂鴉變成照片的工具 pix2pix,得到奇形怪狀的貓咪讓許多人不舒服,不適感超過了涂鴉原本就很糟糕的反思。當時的那款工具是 pix2pix 項目的第一次迭代,學習了數千只貓的顏色和紋路特征。而現在,新的版本接受了人像的訓練,吸引著大批用戶前往恐怖谷觀光。

新版本的使用方法和之前的一樣,在輸入框中繪制人像涂鴉,點擊 process,生成的“照片”就會出現在 output 框中。如果想生成不那么恐怖的圖像,就比較考驗繪畫功力。當然如果畫功欠佳,也可以用 Fiddler AutoResponder 之類的工具導入圖像。

用 Fiddler AutoResponder 導入的圖像所生成的結果,來自 @SyntopiaDK
Pix2pix 基于一種很有前景的技術“生成對抗式網絡”(GAN)。在這項技術當中,兩個神經網絡相互對抗,生成器(Generator)隨機生成一張圖片,鑒別器(Discriminator)則要判斷生成的圖片和真實的樣本孰真孰假。二者相互博弈,砥礪相長,最終人工智能學會生成仿真照片,甚至能用照片合成視頻。
數據集龐大的情況下,GAN 可以從零開始繪制圖片。但在數據比較少時,比如在 pix2pix 當中,GAN 可以做到圖到圖的翻譯。也就是把此前神經網絡所學習的圖像當作繪圖材料,拼貼起來完成對手繪涂鴉的翻譯。在這個過程中,神經網絡分析涂鴉的特征,在數據集中找到相似的特征并配對,最后觀察繪制的結果。

暗黑版的美少女,來自 @degidsan
除了貓咪和人像,pix2pix 只要經過訓練,就可以模仿任何風格,比如把電影變成繪畫。盡管它顯示了機器學習對圖像識別和處理的能力,但要想讓生成的結果更為準確,仍然需要大量的數據和時間來訓練神經網絡。
現在 pix2pix 的服務器可能會有些擁擠,輸入圖形后需要等待一段時間才能得出生成的結果。盡管看上去人工智能對人類仍有很深的誤解,但這項技術有趣的地方在于,GAN 可以是非常有用的機器學習手段,對事物的判斷力也是變得更智能的關鍵。
請登錄以參與評論
現在登錄