谷歌大腦近日發布了一個可以把馬賽克照片還原清晰的軟件。
看樣子是個讓人很有聯想的應用。島國的愛情動作片飄過眼前,有了這款軟件是要徹底攻占騎兵的堡壘,宣告步兵的勝利嗎?
是的,你看到了一篇假文章。
嚴肅臉:下面我們開始認真研究一下谷歌的這款人工智能產品。
其實,把模糊照片放清楚,是有著很實際的用途的。比如說,緝拿犯罪嫌疑人的時候,沒有足夠清晰的照片,可以借助這項功能將照片放大,從而給警方提供更多的線索支持。
谷歌大腦的這款新產品就可以在這方面提供一些頗有價值的幫助。現在他們已經成功將8*8(毫米)網格的像素馬賽克轉換成為肉眼可辨識的人物圖像。這項技術叫做“像素遞歸超分辨率”技術(Pixel Recursive Super Resolution)。
以這組圖片為例。最右側是32 x 32像素的真實圖片,左側是已經壓縮到8 x 8像素的圖片,中間的就是通過這項技術還原的結果。結果不算很理想。還原過的圖片和真實的圖片看起來像是兩個人,但是比起左側的模糊圖片,已經好太多了,左側的圖片單獨來看完全看不出什么內容。
谷歌大腦是怎么做到的呢?它聚合了兩種神經網絡,來補充圖片的細節。
第一部分是條件網絡(conditioning network)。比如,在上面這個案例中,它會將8×8的圖片與高清圖片進行對比,將其他高清圖片縮小到8×8的分辨率,尋找圖案、顏色的相似關系。
第二部分是優先網絡(prior network),使用PixelCNN(像素神經網絡)向8×8的源圖片中增加真實的高清細節。在上面的例子當中,優先網絡就吸收了大量的名人照片。
然后,當需要解析源圖片時,便會從其已知的圖片中尋找與之匹配的新像素,并將添加進去。例如,圖片頂部有一個棕色像素,而優先網絡或許認為那是一條眉毛:于是,當要解析圖片時,就會用眉毛形狀的棕色像素填補進去。
為了制作出最終的無碼高清圖片,需要融合這兩個神經網絡輸出的數據。總結來說,就是通過學習大量圖片,獲得給照片補充細節的能力。OK,這多少有點類似于P圖去水印還原圖片的過程。
谷歌團隊測試了呈現效果。向人類展示高清明星照和還原照片時,人類觀察員被騙的比例達到了10%,而達到50%就屬于完美得分。
在臥室照片的同類對比中,觀察員被騙的比例達到28%。這個得分怎么樣?
此外,谷歌也對比了另一個還原照片的技術——雙三次插值放大技術,這項技術沒有騙過任何一個觀察員。
當然,還原的圖片肯定不同于真實的圖片,會有一些額外添加的細節,這在圖像處理領域里術語被稱作“幻象”,只是計算機的“猜測”,換句話說,系統認為新圖片的清晰度足以“欺騙”人類的眼睛。但是,新添加的細節很可能與事實有別,似是而非。
不過,這項技術也有讓人擔心的地方。隨著這項技術的成熟,肯定可以讓還原照片高度接近真實照片。這樣的話,網上流傳的一些模糊處理的照片就失去了價值,可能導致當事人隱私泄露,帶來人身財產的安全隱患。
轉載自36氪