cookieOptions = {...}; ★ 電腦視覺技術與應用,你必須知道的一切 - 3S Market「全球智慧科技應用」市場資訊網

3S MARKET

3S MARKET
2024年7月17日 星期三

電腦視覺應用如何應用在工作上


 Klacci 凱樂奇 Kii Assistant 智慧酒店服務系統

LogicAI



目錄
  1. 為什麼電腦視覺很重要?
  2. 電腦視覺是如何工作的?
  3. 電腦視覺技術
  4. 電腦視覺的現實應用
  5. 問答


電腦視覺是人工智慧的一個領域,強調使用人工智慧演算法訓練電腦,以便它們能夠捕獲、分析和理解有關影像的基本資訊。電腦視覺模仿人類大腦中與視覺相連的部分,以與我們相同的方式解釋影像。人工智慧、深度學習和神經網路的進步,使這項技術在過去幾年中,成為技術學家和數學家關注的焦點。專家們設想這項技術具有巨大的潛力,他們樂觀地認為,在未來,電腦將能夠比人類更好地感知圖像和影像。

為什麼電腦視覺很重要?

智慧手機是我們生活中不可或缺的一部分。從生日活動和大學年度活動到工作場所慶祝活動和度假自拍,人們在智慧手機中有很多視覺資訊,如照片和影片。除此之外,許多社交媒體平台,如 Instagram 和 Pinterest,每天都在數百萬使用者分享的圖像和影像中蓬勃發展。YouTube 可能是僅次於谷歌的第二大搜尋引擎,每天有數十億人觀看影片,每分鐘都會上傳總觀看時間數百小時的影片。

這顯示網際網路上的大量資訊,以圖像和影像的形式提供。索引文字相對容易,然而,要對視覺資訊進行索引,我們需要辨識圖像和影像的演算法。當電腦視覺不在圖片中時,搜尋引擎依賴於上傳它們的使用者提供的「元」描述。隨著時間的推移,電腦視覺的演算法變得更加複雜。今天,我們有以 99% 的準確度破譯視覺資訊的演算法。除此之外,電腦視覺可以應用於各個行業,以提高業務營運的效率。

電腦視覺是如何工作的?

電腦視覺透過辨識模式來工作。我們訓練模型,透過將視覺資訊暴露在儘可能多的標記影像中來破譯視覺資訊。例如,如果你將電腦暴露在數千張鸚鵡影像中,它將應用各種演算法來分析照片中物體之間的顏色、形狀和距離,以瞭解鸚鵡的外觀。訓練結束後,你可以輸入任何新影像,電腦將根據鸚鵡的經驗,告訴你是否是鸚鵡的影像。

使電腦視覺成為可能的特殊類型的神經網路,是卷積神經網路(CNN)。CNN 將影像分解成稱為濾鏡的較小的畫素網格。每個濾波器都是畫素矩陣,在每個畫素上,網路應用了一系列統計和數學運算。它還將畫素與圖案進行比較。CNN 用於建立物件檢測演算法,例如 SSD(單發多盒檢測)和 YOLO(你只看一次,You Only Look Once)。卷積神經網路中有三種類型的層:卷積層、池層和完全連線層。每個圖層對輸入執行特定任務。CNN 的第一層始終是卷積層,其中在影像上應用濾波器。在 CNN 的第一層中,它可以理解高階模式,如影像的邊緣。隨著網路的進一步複雜化,它開始辨識整個圖片,如動物的臉。

電腦視覺技術

電腦視覺正在產生許多尖端的應用,這些應用正在徹底改變我們的日常生活。在討論這些應用之前,我們將看到一些主要的電腦視覺技術,因為它們是許多簡歷應用的基礎。

影像分類

它指的是將標籤委託給整個照片,也被稱為物體分類或影像辨識。例如,如果你看到楓樹的影像,你可以立即辨識它。你有沒有想過你是如何立即辨識它的?答案很簡單。你以前見過樹木,所以當你遇到樹的圖片時,你的大腦會立即告訴你它屬於樹類。一張圖片可以分為多個類別,例如,一棵樹可以屬於植物或生物的類型。雖然我們的大腦可以很容易地對影像進行分類,但電腦如果不接受深度學習方法,就無法進行分類。每天有數十億張圖片上傳到網際網路上。有人可以手動對每張圖片進行分類,這是不可信的。電腦視覺的影像分類技術,透過快速標記圖片,並將其指定為公共類別,使分類過程自動化。

物件檢測

這是影像分類的一個子任務,但有約束。我們知道,一張照片可能包含多個物體的影像,因此需要一種技術來辨識同一場景中的多個物體。用於物件檢測的常用資料集是 PASCAL Visual Classes 資料集,或 PASCAL VOC。

物件追蹤

此技術用於追蹤影像中的一個或多個移動物件。它有兩類:生成和判別。生成方法解釋了可見特徵,並減輕了獲取物件時的重建錯誤。鑑別方法更精確,用於區分物件及其背景。它也被稱為透過檢測追蹤。

語義分割

它也被稱為物件分割。它的工作原理是圍繞影像中,每個已辨識的物件畫一條線,因為它將整個圖片分成可以標記和分類的畫素組。換句話說,我們可以說,語義分割包括構成圖片的每個畫素。例如,它不僅檢測到圖片中的動物,還會告訴圖片中動物的邊緣在哪裡。

例項分割

它分離了類的不同例項。例如,它用三種不同的顏色,給三隻貓貼上標籤。 在簡單的分類中,我們將影像輸入電腦,目的是描述圖片中的內容。但隔離例項是一項非常複雜的任務,因為我們通常有具有多個物件,和不同背景的視覺資訊。例如,分割,我們不僅需要對這些物件進行分類,還需要檢測邊界、顏色和形狀的差異,以及它們之間的關係。

電腦視覺的現實應用

電腦視覺正在徹底改變每個行業,包括零售、汽車、醫療保健和農業。創新和提供更大的舒適性是這項技術的標誌。在本節中,我們將看到電腦視覺的現實應用是什麼。

零售業

電腦視覺透過向客戶提供有關產品的寶貴資訊,增強了零售業的客戶體驗。 例如,當某家公司推出新產品時,客戶可能會對購買該產品持懷疑態度。然而,使用基於電腦視覺的行動應用,客戶可以獲得有關產品的基本資訊,這將影響客戶的購買決策。除此之外,它正在透過自動化資料收集和改進付款和合規流程,來幫助零售商最佳化其業務營運。該技術還可以透過使用串聯攝影機,密切關注零售店並立即檢測可疑活動,來規避盜竊形式的損失。除了提高商店的安全性外,電腦視覺現在被廣泛用於改善銷售和行銷營運。

以大型線上零售商亞馬遜為例。亞馬遜的最新專案是 AmazonGo 商店,這是使用電腦視覺攝影機,來增強付款流程的典型例子。這家商店採用Just Walk Out技術,因為客戶不必排長隊來支付商品。客戶在進入商店之前,開啟他們的 Android 或 IOS 應用 app。商店裡到處都安裝了攝影機,不僅監控從貨架上撿到的物品,還監控從貨架上撿走的物品的人。如果客戶將物品放回貨架,智慧系統會從客戶的虛擬購物籃中取出該物品。顧名思義,商店的主要想法是,顧客在完成購買後可以離開商店。應用 app 向他們傳送線上收據,他們使用亞馬遜帳戶支付購買的物品。雖然商店沒有收銀員,但員工在幕後工作,監控演算法並不斷訓練它們。

自動駕駛汽車

據世衛組織稱,到 2030 年,道路事故將成為全球第七大死亡原因。很大比例的道路事故死亡,是由人為錯誤和疏忽造成的。公司正在將電腦視覺技術納入汽車,以使人們的整個駕駛體驗更加安全。例如,Waymo 公司,以前稱為谷歌自動駕駛汽車專案,正在使用感測器技術製造自動駕駛汽車。預計這些汽車將使司機的駕駛體驗更安全,並導致未來更少的事故。Waymo 汽車中訓練有素的軟體系統,和感測器能夠監控行人、摩託車手、騎腳踏車者和其他車輛的 360° 運動。該軟體使用演算法進行訓練,以便它能夠遵循交通規則和法規,並辨識障礙,例如,道路中間的物體。它還辨識了其他車輛中人們發出的訊號,以預測他們的移動。這些自動駕駛汽車使用深層網路進行訓練,以便他們能夠像我們一樣處理路上的情況,例如讓位於救護車,減速行人的速度,並為停車的汽車創造空間。

除了 Waymo,到目前為止,特斯拉還推出了三款自動駕駛汽車型號。特斯拉車輛配備了一個攝影機系統,其中包含八台攝影機,也稱為特斯拉視覺、十二個感測器和雷達。攝影機可以 360° 檢視汽車周圍。安裝在車上的超音波攝影機,有助於它準確定位路上的軟物體和硬物體,而雷達確保在大雨、霧和灰塵期間的能見度。



自動駕駛汽車打算減少交通事故,然而,在 2018 年,一輛特斯拉自動駕駛汽車遇到了致命事故,而其自動駕駛模式被啟動。報告顯示,這是司機的錯,因為即使在反覆發出警告後,司機也沒有把手放在方向盤上。使用電腦視覺的自動駕駛汽車技術仍在不斷發展,作為該領域的先驅的企業正在不斷升級其車型。如果司機在三次反覆警告,將手放在方向盤上後沒有回應,特斯拉車型目前的一個改進將使汽車停止。

自動化客戶服務

由於大量尋求幫助的人,安裝智慧家居裝置的新趨勢,使公司的客戶服務部門不堪重負。有時,許多人有一個共同的問題,而問題太小了,以至於客戶自己可以解決它。然而,發現問題本身需要對這些裝置有深刻的理解。公司現在正在考慮使用電腦視覺技術開發自我客戶服務。儘管這是一個新興的電腦視覺應用,但研究人員希望很快看到積極的結果。

配備電腦視覺技術的智慧相機將檢測問題,連線的行動應用 app,將透過提供清晰簡潔的視覺顯示,來指導客戶解決這個問題。如果客戶沒有遵循正確的行動路徑,行動應用 app 還將監控客戶,並在中間打斷他們。

自動資料收集

企業必須彙集客戶資料以提供促銷活動,並審查其購買決定。企業採用不同的技術來收集客戶資料,從使用客戶反饋表間接跟蹤他們。手動收集客戶資料不僅耗時,而且效率低下。電腦視覺可以透過使用臉部辨識,來提高整個過程的功效。客戶的購買模式有助於企業,確定特定產品在客戶中的受歡迎程度,以及哪些產品在哪些地理位置受歡迎。透過這種方式,他們可以根據客戶的興趣、價值觀和地理位置,為客戶建立更個性化的產品。儘管這項技術提供了不可否認的好處,但一些組織和人們對使用臉部辨識系統收集消費者資料表示擔憂。這些人和組織認為,公司不酌情收集客戶資料是不道德的。此外,濫用資料的可能性使這項技術更具爭議性。

製造業

製造業是採用人工智慧實現營運自動化的先驅。人類曾經在工廠長時間工作,參與商品製造、組裝不同組件和維護機器的日子已經一去不復返了。現在,機器人已經負責了該行業的許多業務,導致效率和成本效益空前提高。



電腦視覺為該行業提供了以下好處:

  • 預測性維護:受過電腦視覺訓鏈的攝影機和感測器,在人類看到機器缺陷之前辨識它們。因此,在正確的時間採取正確行動,可以防止機器關閉,並節省大量成本和時間。
  • 產品檢驗:許多行業在包裝產品之前需要清點產品。例如,餅乾製造公司應該在每個包裝中,放與廣告中提到的相同數量的餅乾。電腦視覺可以透過拍攝餅乾的照片,來自動完成整個包裝檢查過程。然後,這些圖片被傳遞給專門的電腦,該電腦進行分析,以確保每塊餅乾都不會壞掉,並且形狀和寬度都正確。
  • 合規性:為了人民的福祉,政府經常對某些行業適用嚴格的規則和法規。生產此類產品的行業應遵守法規,從印刷良好的成分和包裝品質到製造和到期日期。這些業務中的任何差異,都可能導致對公司進行嚴格的法律處罰。手動檢查每個產品及其包裝是不可能的。攝影機可以拍攝物品和包裝的照片,以確保企業遵守所有規則。


醫療保健行業

在醫療保健行業,電腦視覺透過拯救患者的生命,來提供奇蹟般的結果。下面的報導,討論了電腦視覺在醫療保健行業的一些應用:

  • 準確診斷:該技術透過為患者提供準確的診斷,將人為錯誤的可能性降至最低。電腦視覺軟體可以辨識患者的隱藏潛在原因症狀,這些症狀可能會被醫生忽視。除此之外,有時醫生可以向患者建議不需要的昂貴的測試和程式。由於電腦視覺演算法的精度很高,可以避免這些額外的醫療支出。專家們希望,在未來,我們可能會看到電腦視覺演算法的診斷能力大幅增加。
  • 及時診斷:威脅生命的疾病,例如癌症,應在早期診斷。電腦視覺演算法能夠檢測到哪怕是最微小的異常;因此,它們可以在疾病仍然可以治療的早期階段檢測到症狀。
  • 最佳化醫療操作:電腦視覺使許多醫療保健流程自動化,從而為醫生節省時間。因此,醫生可以有更多的時間與患者進行面對面的互動,這對醫生 - 病人的關係很有建設性。透過最佳化醫療流程,電腦視覺可以減輕醫療保健系統的負擔,因為醫生將有額外的時間,來檢查比平時更多的病人。
  • 更好的健康建議:電腦視覺可以透過監測患者的健康和健身狀況,來幫助醫生為患者提供有用的建議。例如,攝影機可以拍攝該人的照片,來分析他/她的身體脂肪。根據電腦視覺系統對這些影像的分析,醫生可以建議一個人減掉身體脂肪。


許多企業都使用電腦視覺技術,開發了智慧醫療裝置和裝置。例如,一家名為高斯外科的公司,使用電腦視覺建構了血液監測解決方案,以監測醫療程式中的失血情況。這些解決方案捕捉了患者在醫療過程中失血的影像,然後由演算法進行處理,以準確估計損失。亞馬遜網路服務(AWS)開發的另一個應用 app,使用 DeepLens 攝影機,來幫助患者檢查和管理一種被稱為牛皮癬的皮膚病。該應用 app 被稱為 DermLens,是將電腦視覺技術用於醫療保健應用的主要例子。

農業工業

在農業行業,電腦視覺系統用於對食品進行分類,辨識缺陷或損壞,並根據其形狀、顏色和尺寸進行分析。



電腦視覺正在以以下方式改變農業行業:

  • 檢測植物疾病:電腦視覺演算法可以在早期階段檢測植物疾病,從而節省成本、時間和資源。有時,植物的疾病症狀是如此微不足道,以到即使是行業專家也忽視了它們。如果從一開始就沒有採取正確的行動,這些疾病將在稍後階段變成一個巨大的問題。
  • 幫助表型:植物表型意味著描述植物的物理特徵和特徵。由於視覺特徵是植物表型的基本特徵,因此電腦視覺演算法,可以比人類更精確地完成。
  • 水果和蔬菜分級:傳統上,人類花費大量時間和精力,根據水果和蔬菜的品質對其進行分級。電腦視覺演算法可以分析水果和蔬菜的影像,並以比人類更高的精度,使用它們的經驗對其進行分級。例如,如果我們向這些演算法提供兩張影像,其中一張是高階香蕉,另一張是缺陷香蕉,那麼軟體可以很容易地區分兩者,並根據其經驗描述它們的等級。

一些行業以比其他行業更快的速度採用電腦視覺技術。採用緩慢背後的原因也許是該技術的不斷發展性質。人類在使用簡歷的行業中的作用,並沒有完全消失,因為我們仍然需要人類來開發演算法,並檢測他們犯的錯誤。

問答

我們為什麼需要電腦視覺?

智慧手機是我們生活中重要的一部分。每天,人們都會上傳和分享大量的視覺資訊。網際網路主要基於文字的日子已經一去不復返了。今天,有了如此龐大的視覺資料,我們需要能夠從這些圖片中提取資訊,並對其進行分析的演算法。此外,電腦視覺的有用應用分佈在零售、汽車、醫療保健和農業等許多行業。


電腦視覺的未來是什麼?

電腦視覺是一種趨勢和不斷發展的技術。許多公司正在使用簡歷來製造自動駕駛汽車、智慧醫療保健裝置和自動化客戶服務軟體。預計在未來,我們生活中的任何方面都不會不受電腦視覺的影響。


電腦視覺是如何工作的?

智慧手機是我們生活中重要的一部分。每天,人們都會上傳和分享大量的視覺資訊。網際網路主要基於文字的日子已經一去不復返了。今天,有了如此龐大的視覺資料,我們需要能夠從這些圖片中提取資訊,並對其進行分析的演算法。此外,電腦視覺的有用應用分佈在零售、汽車、醫療保健和農業等許多行業。


電腦視覺透過辨識模式來工作。我們訓練電腦透過將視覺資訊暴露在儘可能多的標記影像中來破譯視覺資訊。使電腦視覺成為可能的特殊型別的神經網路是卷積神經網路(CNN)。CNN 將影像分解成稱為濾鏡的較小的畫素網格。每個濾波器都是畫素矩陣,在每個畫素上,網路應用了一系列統計和數學運算。它還將畫素與圖案進行比較。CNN 用於建立物件檢測演算法,例如SSD(單鏡頭多盒檢測)和 YOLO(你只看一次)。卷積神經網路中有三種類型的層:卷積層、池層和完全連線層。每個圖層對輸入執行特定任務。CNN 的第一層始終是卷積層,其中在影像上應用濾波器。在 CNN 的第一層中,它可以理解高階模式,如影像的邊緣。隨著網路的進一步複雜化,它開始辨識整個圖片,如動物的臉。



0 comments: