cookieOptions = {...}; .人工智慧的四個核心能力是語音、圖像、自然語言理解和用戶畫像 - 3S Market「全球智慧科技應用」市場資訊網

3S MARKET

3S MARKET
2016年9月14日 星期三

leiphone 程弢


李彦宏:人工智能的四个核心能力是语音、图像、自然语言理解和用户画像

在本月初舉行的百度世界大會上,關於人工智慧話題的探討,毫無懸念成為了主旋律,百度首席科學家吳恩達在這次大會上表示,「人工智慧帶來的影響,不亞於100多年前的電。」

在日前劍橋大學的辯論中心「劍橋名家講堂」上,李彥宏再次強調,人工智慧時代已經到來。他認為在過去16年裡,我們已經從PC網路時代、行動網路時代,跨越到了人工智慧時代。

李彥宏著重介紹了人工智慧的四個核心能力,即語音、圖像、自然語言理解和用戶畫像,因為這些技術,人們使用網路的方式,正在潛移默化中發生改變。

當然,在李彥宏看來,人工智慧改變的不僅僅是普通用戶的生活,未來製造業、金融、教育、醫療、旅遊,以及物流等行業,都將因為人工智慧的這些關鍵技術而被顛覆,人工智慧也不只是巨頭們的「盛宴」,任何企業都能利用這些技術來提升自己的競爭力。

以下為李彥宏在「劍橋名家講堂」演講實錄:
很榮幸能夠來到劍橋和大家交流,我很激動。我也看到這裡今天高朋滿座。

不過我來到這裡不僅僅是來做一個演講,我是來尋找靈感和啓發的。就像艾薩克‧牛頓、查爾斯‧達爾文和斯蒂芬‧霍金這些偉人對我的啓發一樣。當然對我啓發最大的是徐志摩,「輕輕的我走了,就像我輕輕地來」。他的詩句廣為流傳,無論是在哪裡都為人熟知。我們都記得他在劍橋寫下的詩篇。

不過這並不是今天的重點。重要的是,對我而言最具啓發性的偉人是艾倫·圖靈,因為他是現代電腦科學和人工智慧之父。

因此,劍橋是一所很特別的大學,我個人也很嚮往。大家知道,我曾在美國待了8年,先是在美國紐約州立大學布法羅分校攻讀電腦科學碩士學位,隨後又在華爾街和矽谷工作過。1999年,我回中國創建了百度。

我認為,過去16年裡,網路發生了巨大改變。我們大體上經歷了網路的三幕:

第一幕是PC網路時代,稱霸了大約15年;

第二幕是所謂的行動網路時代,增長週期只有四、五年;

而現在,我們迎來了第三幕,即人工智慧時代。

每一幕都各具特色,因此,他們也有不同的迭代速度。

例如,我認為,PC網路時代高度依賴軟體的快速反應。對於我來說,我確實是在軟體時代成長起來的。對於傳統軟體公司,升級軟體一般至少需要6個月,有時甚至要一、兩年。所以人們認為軟體行業總是要花6個月的時間升級軟體,但是網路的到來,極大地改變了這一切。

我們不需要像1997年那樣為網路公司工作,那時我在Infoseek搜索公司工作,我們開始意識到網路公司與軟體公司非常不同,特別是迭代效率這方面。因為在網路公司,我們幾乎可以不間斷地升級軟體,每一天都能升級。一旦升級了代碼和伺服器,所有用戶都能即時享受到這些服務。

這點和傳統軟體公司很不同:他們需要發佈軟體包,6個月之後用戶才能升級最新的版本。而網路公司則不一樣,你可以隨時升級你的伺服器和軟體。

例如,百度每天多次升級我們的服務,這就是一種持續不斷的升級。但是用戶可能看不出來,因為搜索引擎本身看不出有什麼變化,依然是每次在搜索欄輸入問題後,就會顯示答案。

而回溯過去16年,我們可以每天多次進行升級軟體,這就是不同於傳統軟體業的地方,而這也是為什麼大多數的傳統軟體公司,在網路時代表現遜色的原因。這就是PC網路時代。

大約5年前,我認為世界邁入了行動網路時代,即我所說的網路的第二幕。行動網路時代不僅僅是不停地升級軟體,事實上,這個時代的軟體可能3個月、2個月或者1個月才升級一次,時間不固定,沒有規律可言。所以,行動網路的制勝法寶是什麼?我認為是建立自己的生態系統。

但為什麼在PC領域並非如此呢?因為在PC網路時代,一切在國際市場上都是標準的:協議都是http,標記語言都是html。你只需要關注技術本身,其他的東西都已經準備好了。所有的網頁都是開放的,你只需要鏈接網頁就可以獲得全部的內容。

但是行動時代就完全不一樣了。大量的內容灌入到了大量的App中,然而我們並沒有很好的答案。但是有一個好消息是,利用這些App,你可以做更多的事情,而不只是資訊。

網頁的資訊都是標準資訊,但對於行動語言來說,你甚至可以在自己的手機上進行交易。為什麼我們在PC和行動網路有不同的行為呢?這是因為,尤其是對於百度這樣的公司來說,我們要為人們的搜索需求和龐大的交易服務。

在PC時代,用戶使用百度的產品來獲得資訊。但是在行動時代,用戶的期待更多,自然我們需要做的也就更多。當用戶輸入搜索請求的時候,百度搜索更有競爭力,用戶不僅可以搜索到某項服務的資訊,還可以直接訂購該項服務。

不僅能查找服務資訊,還能直接預定服務,免去了在App和搜索頁面之間切換的麻煩,這與之前是不同的。如何才能實現這一點呢?這就要靠我們自己建立一個生態系統,因為並不是所有的App都能整合在一起。因此我們也花了好幾年的時間來完成這些工作。

之前幾年,我們試圖將PC端的搜索功能,轉變成更適應行動時代的搜索服務。一開始我們只是改變搜索界面來使用變小的窗口、適應更慢的網路連接和更貴的上網費用。但這遠遠不夠,需要做出的改變遠不止這些。

因此我們開始在垂直細分領域投資,比如教育、醫療、汽車、旅遊、餐飲等許多重要的行業。

所以不管用戶想從我們這裡得到什麼,不管他們輸入的關鍵詞是什麼,我們都能提供他們所要求的服務。同時,我們還試圖與眾多垂直領域的巨頭建立合作關係,以此來為百度搜索的用戶提供最佳、最流暢的搜索體驗。

當然,不止是百度搜索,還有百度地圖。現在在中國,你只要打開百度地圖,就可以輕鬆預定酒店。你還可以在百度糯米上用折扣價格團購餐飲。事實上,我們在百度地圖上推出預定酒店的功能時,一下子接到了好多訂單,而其中大部分訂單預定的都是當天的酒店。

這和傳統的酒店預定有很大不同。以前,你會提前幾天、甚至幾個星期就在網上預定好了。但在行動網路時代,人們都是抵達目的地以後才打開百度的,因此他們要找的是附近的酒店。
在百度地圖上找到後,就下了當天的訂單。

這是一個很大的改變。行動時代還會為我們,以及像我們這樣的網路公司帶來更多的可能。所以,在過去的幾年中,我們不僅推出了許多更適應行動時代的搜索App,還與許多垂直行業的領軍企業合作,力求為用戶帶來最好的O2O體驗。

消費者尋求的是服務,有些服務在線上就可以滿足,而有些則需要在線下進行。我們提供的正是許多重要行業的線下服務。從這裡大家可以看出來,我們已經不再依賴於標準的網路生態環境了,而是根據自身的需求建立新的生態環境。我們需要和垂直供應商保持良好的合作關係,需要確保用戶可以通過我們的App順暢地交易。

以上就是第二幕,是基於行動時代的網路發展。但是從今年開始,我們正在走進一個新的時代,拉開下一個帷幕。這就是基於人工智慧的網路時代。

同樣,人工智慧時代也不同於PC和行動時代。單從搜索鍵上你就能看到這一點。現在的搜索框中不僅有相機圖標,有的搜索引擎在底部還有麥克風圖標。這與之前的版本有很大區別。因為對於大眾來說,用聲音或相機來表達想法更加簡單。有了這種需求,我們就應該去滿足,關鍵全在於AI。

現在語音辨識的準確率非常高,百度的準確率能夠達到了97%。這97%意味著什麼呢?意味著其精確度甚至超過了人對語音的辨識能力。可以看出,如今語音辨識技術已經相當成熟,足以被運用到許多領域、許多場景。其中最重要的場景之一就是搜索。

當我們從PC時代跨入行動時代時,大家逐漸意識到鍵盤,並不是表達思想最自然的方式。我們這一代是用著筆記型電腦長大的,已經習慣了在鍵盤上敲字,可是智慧手機問世時,鍵盤變成了螢幕上的虛擬鍵盤,觸控螢幕要肩負滑鼠和鍵盤的多重功能。

一開始,大家都覺得這個設計太蠢了,又慢又不精準。但當我看著孩子們用觸摸屏時,一切又是那麼的自然。這是因為相比於在傳統鍵盤上輸入,更加自然的表達方式是手指在觸控螢幕上的點擊。

行動時代之後,聲音和圖片成為了更自然的表達方式。畢竟人們都是先學說話後學會打字,因此若要表達思想,通過聲音表達更加自然。之前機器沒法辨認出語音資訊,所以人們不得不使用鍵盤或觸摸板輸入想表達的資訊;但是多虧人工智慧,人們現在可以使用語音來傳達資訊。

此外,還有圖像辨識。如果你看到一株植物,但是不知道是什麼植物時,那麼拍一張照片,機器就會辨識出其物種。這同樣適用於人臉辨識,當你看到一個人,不知道他是誰,拍一張照片,機器就能自動辨識出來了。原因何在?答案依然是人工智慧。

人工智慧技術非常有用,它不是一個新概念,早在60年前就已經有人創造了「人工智慧」這個詞,但是直到過去10年,我們才意識到人工智慧的重要性,主要是因為今日的計算能力更為廉價和強大。而且,和過去相比較,我們也已經擁有了更多的數據。

擁有大數據和廉價計算能力的人工智慧技術,現在就出現在人們的生活之中。百度在過去的五、六年間,在人工智慧技術方面投入很多,尤其是在深度學習方面。

在今年9月1日,我們舉辦了一年一度的百度世界大會,當時我們發佈了百度大腦,它就是百度人工智慧技術的引擎。百度大腦涉及百度最為核心的人工智慧能力,具體包括語音能力、圖像能力、自然語言處理能力和用戶畫像能力。

我已經提及了語音能力和圖像能力,除此之外,自然語言處理能力也是非常重要的,因為人們在表達他們想法的時候,不僅要知道他們獨特的的性格特點,還要知道他們到底需要什麼,這背後就涉及自然語言處理技術。這是一個不同尋常的領域,所以我們又增加了用戶畫像,因為這也是很有用的,原因就是我們有很多大數據。

我們有許多用戶的數據,例如行為數據、搜索的數據、地理位置資訊等等,所以我們可以對用戶有一個很好的理解,多虧這些,我們可以滿足用戶的需求。背後的人工智慧技術是很重要的,提供了很大的幫助。

我們除了可以增強現有的百度服務:搜索、地圖、貼吧等,我們實際上可以給很多其他的開發人員,提供很多的服務,這樣可以利用我們在過去五、六年中的成果,幫助他們建立自己的優勢。

例如,最近,我們的銷售團隊有些新的嘗試。許多公司的銷售平台的人員薪酬不高,導致人員流失率很高。所以公司總是需要培訓新的銷售人員,教他們銷售技巧,以及如何與客戶交談。一般來說,最佳銷售人員的業績是新銷售人員的十倍。

過去很多公司只是總結一下,最佳銷售人員的銷售技巧,然後讓新員工背下來。所以新員工要花很多時間學習,並使用這些技巧。現在我們研發了一個新系統,來幫助新銷售人員學習,就是當他們打電話給潛在客戶時,我們植入了一個語音辨識引擎,當客戶說話和詢問時,系統會即時辨識問題,並顯示最佳銷售人員,通常會如何回答這個問題。

這在以前是不可能的事,但是有了語音辨識技術後,這就成為了可能。這樣新銷售人員不需要很長的訓練期,他們可以做出和最佳銷售一樣的業績。所以大家可以想像一下,未來語音辨識,將對於全球各個行業有什麼樣的影響。

除了語音辨識,我們發現了其他新的可能。我們有自己的金融服務、網路金融,可以根據圖像辨識技術,辨識人們的面孔。我們可以在幾秒鐘之內,完成學生貸款的服務,因為我們可以辨識身份證上的照片,並與該學生的身份進行匹配,這些都是因為我們有這樣的技術能力。我們也把這個能力和廣告系統做了結合,其中很大的一個領域就是教育。

我們非常瞭解這些教育機構,瞭解他們的畢業生畢業之後的收入水平。我們與這些教育機構合作,向潛在的學生發放學生貸款。教育機構很滿意這樣的合作,因為他們可以找到更多的學生,賺到更多的錢。學生也很滿意,因為這意味著他們可以不用依靠自己的儲蓄上學,而是可以選擇貸款上學。

我們也很有利,因為可以賺取貸款利息。這一切都得益於技術的發展,讓我們可以評估所有學生和潛在學生的信用。還有自然語言理解能力,也是IT業內的一大趨勢。

最近很多公司在努力研發虛擬助手,以百度為例,我們推出了一款叫作「度秘」的虛擬助手,人們可以用自然語言和它對話。它能講笑話,幫你訂飯店,回答一些一般需要用搜索引擎解決的問題,而且它正在變得越來越智慧。

「度秘」是我們在一年之前發佈的,之後的每一天,它都在不斷進步,幾個月前我們用它來講解籃球奧運會比賽,結果它表現很好,基本上和人類的解說一樣好。以後我們會把這種自然語言界面變為新的平台,對話就是新平台。

未來,不再需要做API(應用介面程序),不用學怎麼使用新的遙控器、鍵盤,因為人們只用說話就夠了。通過自然語言理解,所有的工作就都可以被完成了。

用戶畫像技術也將幫助到很多行業,比如行銷。去年6月,傳奇影業讓我們幫助他們宣傳在中國即將上映的電影《魔獸》。我們利用自身的用戶挖掘技術,吸引更多人去觀影。我們將用戶分為三組,第一組是這部電影的忠誠粉絲,不需要任何的宣傳也會去看。第二組是猶豫不決的用戶。第三組是無論如何宣傳都絕不會去看這部電影的人。

我們的工作是找到並辨識這三組用戶,並轉化猶豫不決的用戶們,促使他們去電影院看電影。我們通過用戶畫像,找出搖擺不定的用戶組,進行行銷。我們對於這種行銷手段最初的預期是提高5%的收入,結果提高了超過200%。

我們非常瞭解用戶,知道他們是誰、喜歡什麼、收入多少,通過進行這些分析,我們可以做很多事情。我們目前才剛剛開始這方面技術的探索,只和幾家外部合作夥伴進行了嘗試。一旦各個行業瞭解了語音、圖像、自然語言理解、用戶畫像技術的作用,應用的可能性是無限的。


在人工智慧時代,每個人都會受影響,不僅是IT公司,從製造業到金融,從教育到醫療,從旅遊到物流等行業,都將會面臨轉型和顛覆。我認為只要你做好準備,就能利用這些技術來提升自己的競爭力。在人工智慧的時代,我們必須重新設想方方面面的可能性,(重新設想)我們的公司、行業和世界的無限可能。



                                                                                                                                                                                                                            


0 comments: