．「新人類」即將誕生，AI 邁入造人新時代

Breathtaking Historical Portraits Brought To Life Using AI Technology

借助 AI 技術將歷史人物肖像帶入生活

來源：算力智庫

人工智慧已經可以自動生成，以假亂真的人像照片「忽悠」人類了。憑借「對抗神經網路」，人工智慧從「學習」和「辨識」進化到了「創造」。

有專家將此技術與深度卷積神經網路、Alpha Go，並稱為人工智慧的三大發展。當然，基於大數據和大計算的人工智慧，也存在著「先天不足」，至少在理解和「舉一反三」方面還有很長的路要走。

一個頗為無聊的國外網站最近火了。

這一名為「此人不存在」（This Person Does Not Exist）的網站沒有任何介面設計，輸入網址後顯示的只有一張人像大頭照。新奇之處就在於，每次打開或刷新頁面，顯示的照片都不同，並且都不是真實存在的人物照片。

換言之，所有照片都是隨機「生成」的，而其背後正是人工智慧的支撐。可以看出，人工智慧已經從「學習」和「辨識」，開始進化到「想像」和「創造」。

從網站上的照片來看，不僅實現了無限「生成」，而且還生成得不錯 —— 人物有男有女，有老有少，不同人種、不同角度、不同表情，甚至還有眼鏡和佩飾，可謂以假亂真。

事實上，賦予人工智慧想像力和創造力的，正是被《MIT 科技評論》評為 2018 十大科技突破之一的「對抗神經網路」。

據《MIT 科技評論》介紹，「對抗」是指兩個神經網路使用同一個數據集進行訓練。其中一個神經網路叫生成網路（the generator），它的任務就是依照所見過的圖片，來生成新的圖片，而另外那個神經網路叫判別網路（the discriminator），它的任務則是判斷，它所見得圖片，是否與訓練時的圖片相似。

慢慢地，生成網路創造圖片的能力，會強到無法被判別網路識破的程度。經過訓練的生成網路，學會了辨識，並創造看起來十分真實的圖片。這項技術已成為過去 10 年，最具潛力的人工智慧突破，幫助機器產生可以「忽悠」人類的成果。

生成式對抗網路「創造」出的人像（現實中不存在此人）具有十足「迷惑性」

更令人驚嘆的是，這樣的「生成」還不限於圖像。

「兩個卷積神經網路，透過相互對抗，生成超解析度真實感的原創圖像、聲音、3D 物體或自然時序數據，這給 AI 帶來一種類似於人類的想像力。」

AI 的三大主義與三大發展

令人嘆為觀止的人像「創造」背後，必然是對海量原始照片的學習。

生物智慧的一個主要特徵就是學習，而新一輪人工智慧的鮮明特點就是學習能力。無論是生物智慧還是人工智慧，智慧的主要特點就是感知能力、認知能力和行動能力。

追本溯源，智慧的這三大特點源自連接主義、行為主義和符號主義。連接主義是生物智慧的解剖學基礎，即生物神經系統所包含的神經元、神經元的活性及其相互作用。

在此之上，行為主義透過獎勵/懲罰進行自主學習，強化學習也是人類和動植物行為，學習的主要方式。最後，符號主義極大促進了人類的智力發育，尤其是語言的發明成為了人類智慧遠超其他生物智慧的分水嶺。

以「三大主義」為基礎，人工智慧在最近五六年，取得了飛速發展。目前來看，在大數據和大計算的驅動下，深度學習已成為電腦視覺、語音辨識與合成、自然語言處理和大數據分析等的主流方法。以深度卷積神經網路為基礎的，新一代人工智慧，確實帶來了更接近於人類視聽覺的感知能力。

因此，數據驅動的方法，已被視為繼實驗科學、理論模型、模擬仿真之後的第四科學研究範式 —— 數據驅動的科學範式，其如同網路技術，已逐漸變革為一種通用賦能工具。從「互聯網＋」到「人工智慧＋」，新一代人工智慧，已經遠遠超出了電腦科學技術的範疇。

大數據和大計算，讓人工智慧迎來了大發展，總結了人工智慧的三大進展。

首先是深度卷積神經網路，令大數據感知智慧，取得突破性進展。人工智慧已經能獲得，更加接近於人類水準的視聽覺感知能力，和對文本自然語言的模式分類能力，從而賦能產品、流程和服務體驗，引發了技術變革和產業革命。

這一領域最為人熟知的例子就是自動駕駛，以全球首個自動駕駛商用服務 Waymo One 為例，其估值已超千億美元。

另外，在醫學影像領域，谷歌的人工智慧深度卷積神經網路，已經可以根據視網膜影像，來準確判斷一個人的年齡、性別、血壓、是否吸煙等，甚至可預測肺癌、乳癌等，達到了國際頂級醫生的診斷水平。

其次是超人類水準的Alpha Go，引發全社會強烈關注，在此基礎上，進化而來的 Alpha Zero，更是帶來了無需大數據，就可自主學習的棋類通用人工智慧。Alpha Zero 經過 8 小時 16.5 萬次訓練，就擊敗了 Alpha Go 戰勝李世石的版本。

第三大進展是對抗性神經網路，帶來了超真實感的想像能力，也就是上述人工智慧，「創造」人像的案例所表現的。

生成式對抗網路（GAN），是目前最為成功的生成式神經網路模型，透過與強化學習及蒙特卡洛搜索等的結合，推動了半監督與無監督學習方法的發展。

https://www.theverge.com/tldr/2019/2/15/18226005/ai-generated-fake-people-portraits-thispersondoesnotexist-stylegan

大數據 AI 的先天不足

以大數據為燃料，餵食越多，人工智慧越能獲得更好的感知直覺。但問題隨之而來，首先是對大數據的清洗和標籤，需要付出很高代價。

其次，在落地應用中，在開放環境下，實際是不存在完備的大數據的。對於各種應用場景，大數據人工智慧均只能獲得，較接近於人類水準的視聽覺等感知能力，這與各種基於公開測評數據，收集得到的性能指標，是完全不同的。

簡言之，人工智慧或許在測試狀態下表現良好，但在實際落地應用中的表現，卻可能差強人意。

此外，基於深度學習的電腦視聽覺感知方法，不僅依賴大數據的驅動，也缺乏人類舉一反三的，基於小樣本的學習能力，和對目標的認知水準的理解能力，並且缺乏記憶、沒有常識、不能運用經驗，缺乏技巧和知識學習能力。

比如，人們開車轉彎或掉頭就是過程性經驗。大腦記住後，每當轉彎就不需要再思考，而是可以條件反射地做出動作。

人類的思維方式，並不完全依靠特徵提取，很多時候是靠理解和推理，但目前人工智慧並不具備這樣的能力，也就不具有規劃決策和思考能力。

把大數據人工智慧面臨的挑戰，歸結為：人工智慧缺乏自己的語言。相比之下，語言卻是人類的「致勝法寶」。人類高層認知能力，其實是透過記憶語言去思考和推理的。記憶以及知識的運用，都是基於語言的。

另外，大數據人工智慧的發展，還會帶來法律、倫理、隱私安全和失業等方面的挑戰。

儘管當下的人工智慧還非常弱，「落地」也只能在特定應用領域發揮作用，還極度依賴大數據。但隨著人工智慧的進一步發展，也就是認知智慧和通用人工智慧的發展，或許會對技術與產業帶來變革，甚至威脅到人類的安全。

「但總體來說，現在的弱人工智慧，對於人類是賦能和有益的」。

擁有自己語言的下一代人工智慧

對於人工智慧的未來突破點，關鍵就在於從感知智慧，向認知智慧的進化。目前人工智慧主要追求看清、聽清，能夠辨識，別但沒有理解，屬於感知智慧範疇。

未來人工智慧的發展目標，將是如何看懂、聽懂和讀懂，從而具備基本的認知智慧，這也是從弱人工智慧，向通用或強人工智慧進化的方向。

所謂認知智慧，就是指對目標或實體具有理解能力，理解事物的內涵和外延。其發展趨勢就是要探索舉一反三的認知智慧，即以大數據感知智慧＋圖模型/知識圖譜為基礎，利用圖卷積神經網路，從特徵學習拓展到知識學習。

而通用人工智慧，則包含了多任務的自主學習、自適應與自組織能力。其發展趨勢，是基於連接主義的深度神經網路，透過與行為主義的強化學習，特別是與具有學習能力的符號主義的有機結合，從 Alpha Zero 這樣的新起點出發，發展出具有更寬垂直領域的通用人工智慧。

總之，透過深度學習與無監督學習、機率，或模糊圖模型知識圖譜，進行深度融合，讓下一代人工智慧擁有自己的語言，並能根據數據和常識自主學習，是探索認知能力，與通用人工智慧的關鍵路徑之一。

AKD 零售櫃檯專用監視攝影機

按此回今日3S Market新聞首頁

3S MARKET

．「新人類」即將誕生，AI 邁入造人新時代

0 comments:

Recent Comments

Arsip Blog

．「新人類」即將誕生，AI 邁入造人新時代

Related Posts

0 comments: