Computer Vision Projects Ideas
電腦視覺專案的創意構想
禾企 SHANY 紅外線 熱顯像儀 熱成像 熱顯測溫 100% 台灣製造
來源:张康康
得益於人工智慧的飛速發展,電腦視覺慢慢的出現在人們的視野裡,並廣泛的應用在生活與工作中,無論是人臉辨識、影像辨識,還是安控保全、Face ID、刷臉支付,都滲入到了我們的生活中。本文盤點了電腦視覺領域八大熱門事件。
極鏈科技Video++奪冠Google AI地標辨識大賽
之前,Google 推出了目前世界上最大的人造和自然地標辨識數據 Google-Landmarks。數據集中包含了 200 萬張圖片,囊括了全球 30000 處的獨特地標,量級是普通的數據集的 30 倍,數據達到前所未有的龐大體量。經過近 3 個月的激烈角逐,由 Google 主辦的 2018 Google 地標辨識挑戰賽揭曉後,來自極鏈科技Video++AI 團隊的參賽者,以大比分優勢獲得第1名。
作為本次挑戰賽的獲勝者,Video++將受邀在美國舉辦的CVPR會議上發表技術研討,該會議是全球電腦視覺領域的頂級會議,在會議業界和學界都享負盛名。
英偉達面目生成器
由英偉達的 AI 團隊為 GAN 創造了一種新的生成器,連 GAN 之父 Goodfellow 也忍不住發出稱讚。他們提出的新架構,可以完成自動學習,無監督地分離搞基屬性,以及生成圖像中的隨機變化,並且可以合成進行更直接,且特定於比例的控制。
也就是說,這種新的生成器在生成和混合圖像,特別是人臉圖像時,可以更好地感知圖像之間有意義的變化,並且在各種尺度上,針對這些變化做出引導。
臉部模糊技術
來自 SFU 交互式藝術與技術學院(SIAT)的一個研究小組,提出了一種在需要匿名的新聞報導中,取代模糊面孔的新方法。該團隊使用了人工智慧技術,目的在改變人物的臉部特徵,並加入視覺效果,更明確地表達出人物的情感。
據 SFU 負責人描述,他們的人工智慧學習了一千多年來的繪畫技巧,可以系統性的改變人物臉部特徵,例如拉長臉部,放大眼睛等等,同時保持主題的內在,也就是盡可能地準確表達人物的情感。
PS 照片甄別技術
Adobe 公司曾在 CVPR 電腦視覺大會上展示了,用機器取代人類進行數位圖像取證的技術,利用神經網路,透過真實的篡改圖像,訓練辨識出那些被改動過的圖片。
Adobe 高級研究科學家表示,他們開發出了全世界功能最強大的圖像編輯軟體,但今天他們要利用 AI 創造出,能甄別圖像真偽的工具,幫助人們鑒別和監控資訊時代,數位媒體的真實性,並且讓司法取證更加公正。
經過處理的照片,或許能夠騙過人的眼睛,但往往會留下改圖痕跡,比如邊緣的對比度很大,刻意平滑的區域,或不同的噪聲樣式。而 Adobe 的算法能夠感知這些細微的差別,檢測出圖片中的異常。除此以外,它還可以區分各種篡改技術。
人工智慧老化技術
來自康乃爾大學的科學家,利用先進的人工智慧,來渲染更真實的人工老化。這種 AI 技術在將來,或將可以透過預測人們在未來的相貌,幫助尋找失聯兒童或在逃嫌犯,幫助警察破解真實失蹤案件。
該系統使用一種生成對抗網路(GAN)AI 算法。第一部分拍攝一張臉,並生成同一個人,在目標年齡的另一張臉。第二部分將該圖像與該年齡段的人的真實圖像,以及原始圖像進行比較,並提供反饋,透過訓練和反饋,提高第一部分的辨識正確率。
不同與以往,同樣使用生成對抗網路(GAN)的人工老化系統,該系統改進了人臉變老技術,不僅注重年齡的正確性,還注重維護個人的身份。同時,在進行人臉回歸時,作者還考慮了人臉的許多背景資訊,包括額頭、頭髮等。
BigGAN 發佈
Ian Goodfellow 在 2014 年設計了GAN,在之後的幾年中,圍繞這個概念,產生了多種多樣的應用。其中,在 ICLR 2019 論文中出現的 Big GAN,同樣是一個 GAN,只不過更強大,是擁有了更聰明的課程學習技巧的 GAN,由它訓練生成的圖像,連它自己都分辨不出真假,因為除非拿顯微鏡看,否則將無法判斷該圖像,是否有任何問題,因而,它更被譽為史上最強的圖像生成器。
阿里巴巴展示菜鳥 AI 客服助手
2018 年的神經資訊處理系統大會(Neural Information processing Systems Conference)上,阿里巴巴展示了其菜鳥物流公司的 AI 客服助手,給人留下了深刻的印象。
以色列著名電腦視覺科學家入職阿里巴巴達摩院
阿里巴巴前沿技術研究機構達摩院傳來新消息。以色列理工學院著名電腦視覺科學家 Lihi Zelnik Manor 教授,已入職達摩院以色列機器視覺實驗室。
Lihi Zelnik Manor 從魏茲曼科學研究所獲得電腦博士學位,2007 年進入以色列理工學院電氣工程系擔任副教授、計算圖像與多媒體實驗室研究員。其研究興趣為電腦視覺,以及在真實應用場景中,分析推斷影像和圖像集的內容。曾多次獲得 IEEE 與 ICCV 的傑出論文獎,並連續多年擔任 ECCV 與 CVPR 等電腦視覺大會主席,也是頂級學術期刊 TPAMI 的核心編輯。
作為實驗室負責人,她將帶領團隊推動達摩院電腦視覺領域的基礎研究,以及智慧零售、智慧城市等廣泛領域的應用結合。
沒有留言:
張貼留言