騰訊科技 譚思
谷歌的圖像辨識神經網路,不但可以辨識圖像,而且可以製造出人意料的奇幻景象。
機器有什麼夢想?谷歌新發佈的一些機器辨識圖像,為我們給出了一個可能的答案:將不同的景物合成一種奇幻風景。
這些照片是由谷歌的圖像辨識神經網路產生的,該網路已被“教育”,以辨識建築物、動物和物體等圖像。
研究人員將圖片輸入圖像辨識神經網路,並讓它辨識該圖片中的一個特徵,並修改圖片以強調這項特徵。修改後的圖像然後被回饋到神經網路,並讓神經網路再次辨識其他特徵並強調它們。最終,這幅圖片被修改得面目全非。
在一個低水準上,這種神經網路可以被用來檢測圖像的邊界。在這種情況下,這些圖像就像繪畫作品,使用過Photoshop濾鏡的人應該對此感到不陌生:
但是,如果神經網路被要求辨識更複雜的圖像,——例如辨識一頭動物,它會產生令人不安的奇幻圖景:
最終,這個軟體可以對隨機雜訊進行辨識,但生成的結果完全屬於自身的想像:
如果你讓一個用來辨識建築物的神經網路,去辨識一幅毫無特徵的圖像,它將產生這樣的結果:
這些照片是驚人的,但他們不僅僅是用來展示的。神經網路具有機器學習的一個共同特徵:它不是向電腦輸入程式,以讓它能夠辨識特定的圖像,而是向它輸入許多圖像,並讓它自己整合這些圖像的關鍵特徵。
但是,這可能會導致軟體更加出人意料。我們很難知道軟體正在審查哪些特徵,以及它忽略了哪些特徵。例如,研究人員要求神經網路,在一幅隨機雜訊圖像中辨識啞鈴,發現它認為啞鈴一定是有手臂握住的:
解決方案可能是向它輸入,更多放在地上的啞鈴圖像,直到它明白手臂並非啞鈴的內在組成部分。
“神經網路面臨的一個挑戰是逐層辨識。例如,第一層可以辨識邊緣或拐角。中間層辨識基本特徵,以尋求整體的形狀或部件,例如門或葉子的形狀。最後幾層將這些組合成一個完整的圖像,在辨識非常複雜的事情時,——如整個建築物或樹木,這些神經元很活躍。”谷歌的工程師解釋說。
圖像辨識軟體已經成為消費產品,如谷歌新的照片服務Google Photos。Google Photos可以根據文本搜索圖像:例如,你輸入“狗”,它將提供谷歌找到的所有包含狗的照片(偶爾也會出現其他四足哺乳動物的照片)。
所以,未來機器人的夢想,將不僅僅是製造電子綿羊,它們的夢想是製造出更加令人吃驚的夢幻奇景。
沒有留言:
張貼留言