2018年7月13日 星期五

.人工智慧之 AI 與 Big Data

Big Data Analysis and Artificial Intelligence


来源:AI优化生活

人工智慧(AI)」和」大數據 (Big Data)」兩個詞以迅雷不及掩耳之勢流行開來,那麼這兩者之間有什麼關係嗎?常常有人把兩者混肴在一起。有必要釐清一下它們之間的聯繫和區別。





一個共同點就是這兩項技術,都被炒得非常火熱。根據調查發現,超過97%的企業高管表示,他們的公司正在投資、建構或啓動大數據和人工智慧計劃。更重要的是,近80%的企業高管認為人工智慧和大數據密切相關。可以肯定的是,它們是完成任務的不同工具。

首先從定義出發:

人工智慧(AI)是研究、開發用於模擬、延伸和擴展人的智慧的理論、方法、技術及應用系統的一門新的技術科學。它是指電腦系統具備的能力,該能力可以履行原本只有依靠人類智慧才能完成的複雜任務

人工智能在上世紀80—90年代曾經一度低迷。近年來,由於成本低廉的大規模並行計算大數據深度學習人腦晶片4大催化劑的齊備,導致人工智慧的發展出現了井噴趨勢。





大數據(Big Data)是指無法在一定時間範圍內,用常規軟體工具,進行捕捉、管理和處理的數據集合,是需要新處理模式,才能具有更強的決策力洞察發現力,流程優化能力的海量、高成長率和多樣化的資訊資產





人工智慧和大數據聯繫:
人工智慧打個比方,像張無忌吸收好多武林前輩的武功秘籍,不斷的深度學習和廣泛訓練,逐漸進化升級為一個武林高手。

大數據相當於張無忌從小到大學習、記憶和儲存的海量武功秘籍(武學知識),這些武學知識只有透過他消化、吸收、再造才能創造出更大的價值或本領。

可以看出,大數據是不斷採集、沈澱、分類等數據累積,人工智慧是基於大數據的支持和採集,運用於人工設定的特定性能,和運算方式來實現。因此,人工智慧離不開大數據,人工智慧需要依賴大數據平台和技術,來幫助完成深度學習進化。

當今人工智慧立足於深度(多層)神經網路,進行深度機器學習,可以根據大量的訓練數據,來提高模型優化能力。但這一顯著優點,需要增加海量的運算。

隨著電腦運算能力提升,深度神經網路發揮了傑出的實際應用價值。高速並行運算、海量數據、更優化的算法,共同促成了人工智慧發展的突破-所釋放出來的力量,將徹底改變和優化人們的工作和生活(科技優化生活^_^)!這對人類的發展產生意義重大且深遠的影響。

人工智慧涉及的領域非常廣泛,且深入人們的工作和生活各個方面。人工智慧,特別是深度學習,需要大量數據的應用和累積。這就需要高容量儲存設備,來支持大量數據的留存。

隨著數據的不斷增加,人們開始在其中發現某種規律,引發了分析的需求。分析讓大量的數據有了價值,嵌有人工智慧的機器開始懂得用戶想要什麼,需要幹什麼,可以預測未來變化或趨勢,這種人工智慧與場景的結合,要實現的就是改變生活方式和解放生產力。

很多過去只有人能做的事情,現在更多的情況下,能夠透過機器實現,比如語音助手、無人駕駛汽車。更重要的是,當硬體性能逐漸提升、計算資源越來越強大時,成本卻越來越低廉。

人工智慧和大數據區別:
大數據是需要在數據變得有用之前,進行清理、結構化和整合的原始輸入,而人工智慧則是輸出,即處理數據產生的智慧。這使得兩者有著本質上的不同。

人工智慧是一種計算形式,它允許機器執行認知功能,例如對輸入起作用或作出反應,類似於人類的做法。人工智慧系統不斷改變它們的行為,以適應調查結果的變化,並修改它們的反應。人工智慧系統旨在分析和解釋數據,然後根據這些解釋,來解決實際問題。

人工智慧是關於決策和學習,做出更好的決定。在某些方面人工智慧會代替或部分代替人類,來完成某些任務,但比人類速度更快,錯誤更少。


大數據是一種傳統計算。它不會根據結果採取行動,而只是尋找結果。它定義了非常大的數據集,可以存在結構化數據,或非結構化數據(在使用上也有差異)。大數據主要是為了獲得洞察力。





人工智慧和大數據協同:
雖然人工智慧和大數據有很大的區別,但它們仍然能夠很好地協同工作。這是因為人工智慧需要數據來建立其智慧,特別是機器學習。

機器學習中,為了訓練模型,需要大量的數據,而且數據需要結構化和整合到足夠好的程度,以便機器能夠可靠地辨識數據中的有用模式。大數據技術滿足這樣的要求。

人工智慧是基於大數據的支持和採集,運用於人工設定的特定性能和運算方式來實現的,大數據是不斷採集、沈澱、分類等數據累積。

大數據提供了大量的數據,並且能從大量繁雜的數據中,提取或分離出有用的數據,然後供人工智慧來使用。即人工智慧和機器學習中,使用的數據已經被「清理」了,無關的、重複的和不必要的數據,已經被清除。這些「清理」工作,是由大數據技術,來完成或保障的。

大數據可以提供,訓練學習算法所需的數據。有兩種類型的數據學習:初期離線訓練數據學習,和長期線上訓練數據學習。人工智慧應用程序,一旦完成最初離線培訓,並不會停止數據學習。隨著數據的變化,它們將繼續線上收集新數據,並調整它們的行動。

因此,數據分為初期的和長期的(持續的)。機器學習從初期和長期收集到的數據中,不斷學習和訓練。不斷學習和磨練其人工智慧的模型和參數

人工智慧發展的最大飛躍,是大規模並行處理器的出現,特別是GPU,它是具有數千個內核的,大規模並行處理單元。這大大加快了人工智慧算法的計算速度。

人工智慧需要透過試驗和錯誤學習,這需要大量的數據,來教授和培訓人工智慧。人工智慧應用的數據越多,其獲得的結果就越準確。因此可以看出,人工智慧是依託於大數據,或者說人工智慧底層基於大數據。

此外,在大數據發揮作用的同時,人工智慧研發者也一定不要忘了,大數據的應用必然會帶來個人隱私保護方面的挑戰。有效、合法、合理地收集、利用、保護大數據,是人工智慧時代的基本要求。

最後還要澄清的一點是:大數據在人工智慧中的作用,是將人類或物體行為活動,抽象為或轉變為海量數據,對數據清洗、提質等預處理,供人工智慧系統使用,而對數據進行智慧分析的人工智慧,只是人工智慧的一部分,並非全部

結語:

人工智慧和大數據既有聯繫又有區別,且可以協同工作。人工智慧需要透過試驗和錯誤學習,需要大數據來教授和培訓人工智慧。人工智慧需要依託大數據來建立其智慧。

在大數據在人工智慧中發揮作用的同時,人工智慧研發者千萬不要忘了,合理地收集和利用大數據,注意個人隱私的保護。對數據進行智慧分析的人工智慧,只是人工智慧的一部分,並非全部

沒有留言:

張貼留言