‧ 製造幻景：谷歌圖像辨識神經網路 讓人大跌眼鏡

騰訊科技譚思

谷歌的圖像辨識神經網路，不但可以辨識圖像，而且可以製造出人意料的奇幻景象。

機器有什麼夢想？谷歌新發佈的一些機器辨識圖像，為我們給出了一個可能的答案：將不同的景物合成一種奇幻風景。

這些照片是由谷歌的圖像辨識神經網路產生的，該網路已被“教育”，以辨識建築物、動物和物體等圖像。

研究人員將圖片輸入圖像辨識神經網路，並讓它辨識該圖片中的一個特徵，並修改圖片以強調這項特徵。修改後的圖像然後被回饋到神經網路，並讓神經網路再次辨識其他特徵並強調它們。最終，這幅圖片被修改得面目全非。

在一個低水準上，這種神經網路可以被用來檢測圖像的邊界。在這種情況下，這些圖像就像繪畫作品，使用過Photoshop濾鏡的人應該對此感到不陌生：

但是，如果神經網路被要求辨識更複雜的圖像，——例如辨識一頭動物，它會產生令人不安的奇幻圖景：

最終，這個軟體可以對隨機雜訊進行辨識，但生成的結果完全屬於自身的想像：

如果你讓一個用來辨識建築物的神經網路，去辨識一幅毫無特徵的圖像，它將產生這樣的結果：

這些照片是驚人的，但他們不僅僅是用來展示的。神經網路具有機器學習的一個共同特徵：它不是向電腦輸入程式，以讓它能夠辨識特定的圖像，而是向它輸入許多圖像，並讓它自己整合這些圖像的關鍵特徵。

但是，這可能會導致軟體更加出人意料。我們很難知道軟體正在審查哪些特徵，以及它忽略了哪些特徵。例如，研究人員要求神經網路，在一幅隨機雜訊圖像中辨識啞鈴，發現它認為啞鈴一定是有手臂握住的：

解決方案可能是向它輸入，更多放在地上的啞鈴圖像，直到它明白手臂並非啞鈴的內在組成部分。

“神經網路面臨的一個挑戰是逐層辨識。例如，第一層可以辨識邊緣或拐角。中間層辨識基本特徵，以尋求整體的形狀或部件，例如門或葉子的形狀。最後幾層將這些組合成一個完整的圖像，在辨識非常複雜的事情時，——如整個建築物或樹木，這些神經元很活躍。”谷歌的工程師解釋說。

圖像辨識軟體已經成為消費產品，如谷歌新的照片服務Google Photos。Google Photos可以根據文本搜索圖像：例如，你輸入“狗”，它將提供谷歌找到的所有包含狗的照片（偶爾也會出現其他四足哺乳動物的照片）。

所以，未來機器人的夢想，將不僅僅是製造電子綿羊，它們的夢想是製造出更加令人吃驚的夢幻奇景。

3S MARKET