設萬維讀者為首頁 廣告服務 聯繫我們 關於萬維
簡體 繁體 手機版
分類廣告
版主:諍友
萬維讀者網 > 教育學術 > 帖子
人工智能及其應用簡介
送交者: 劉以棟 2019年02月26日20:44:09 於 [教育學術] 發送悄悄話

人工智能及其應用簡介


劉以棟



當今世界,人工智能是一個熱門話題,有人甚至預言以後可以娶一個機器人做老婆,這無異於天方夜譚。


出於對人工智能的興趣,我自己也去讀了一些人工智能的入門書。這是我人工智能讀書報告第一篇,以後會有人工智能不同領域的讀書報告。我自己不是做人工智能方面工作,所以只是編譯了這篇科普文章,不到之處請諒解。


人工智能本身不是一個新概念。早在1956年夏天,一幫科學家就在達特茅斯大學提出了計算機的推理能力功能。距今已經60多年。


人工智能簡單的來說包括三個部分,接受信息,處理信息和做出行動。當然,這其中任何一部分都可以是人工智能的一個研究領域。接受信息包括語音識別,模式識別,計算機視覺等。處理信息就是計算機的推理能力,最有名的例子就是下圍棋的阿法狗(AlphaGo)。 行動部分的例子包括機器人和自動駕駛車。


在討論人工智能以前,讓我們先複習一下人的七種智能。


  1. 視覺空間智能(Visual-Spatial Intelligence)

周圍環境辨別能力是任何運動機器人都需要掌握的能力。自動駕駛車和自動吸塵器都需要看到周圍的情況。吸塵器要求精度低。人工智能在這方面只能達到中等水平。


  1. 身體運動智能 (Bodily Kinesthetic Intelligence)

外科醫生和舞蹈演員需要調整身體姿勢來完成動作。人工智能可以輔助醫生做手術。機器人需要在人的指令下操作。這方面人工智能可以達到中高水平。


  1. 創造智能 (Creative Intelligence)

創造智能包括新的想法,新的音樂篇章,發現新的模式,新的發明等。人工智能可以模仿人的行為,但是它自己不能有發明創造。人工智能在這方面的潛力是零。


  1. 人際交往智能 (Interpersonal Intelligence)

人和人之間的相互交流,譬如會議上或者電話上交流信息等,不是人工智能所長。人工智能可以根據關鍵詞回答簡單問題,但是人工智能不能理解整個句子。這個方面人工智能只能達到低中水平。


  1. 內心自省智能 (Intrapersonal Intelligence)

一個人通過反省,發現自己的興趣和專長,然後設定自己的奮鬥目標,是人類特有的能力。人工智能在這方面的潛力是零。


  1. 語言智能 (Linguistic Intelligence)

語言交流能力,包括聽懂對方講話,或者讀懂對方的信函,然後通過思考,作出回答。人工智能一般不能聽懂對方講話,也不能讀懂書信,更不要說根據對方要求做出回答了。人工智能在語言交流方面只能達到初等水平。


  1. 邏輯數學智能 (Logical - Mathematical Intelligence)

進行數學運算,探索模式,尋找規律是人工智能所長。人工智能在這方面可以達到高級水平。


不管我們是否喜歡人工智能,人工智能已經進入了我們生活中的方方面面。


我們打字時,人工智能經常給我們改錯。有的時候,人工智能提出改正要求,等我們確認。有的時候,人工智能來不及等我們確認,自己做決定。譬如,如果我們開車時,前面有障礙,人工智能可以緊急剎車。人工智能反應比人快。


人工智能也可以使我們工作中的許多事情自動化。自動取款機應該算人工智能的一種形式。


自動化可以取代我們工作中的無聊重複部分,使得我們的工作更有趣。我們去工作,掙錢是一部分原因,從工作中取得的滿足感是另一部分原因。自動化還可以提高工作效率,增加工作環境的安全性。


人工智能在醫療方面也有許多應用。人工智能醫療儀器可以戴在身上,這樣可以收集長期數據,監督病人情況。人工儀器也可以增加人的體能,人可以通過穿着一種機器人(Exoskeleton, 外骨骼),這樣可以跑得更快,負重更多 …..


機器人護理有它的兩面性。一方面,機器人做事可能更客觀,另一方面,人是有感情的。機器人不會提供同情和理解。


人工智能在人和人之間的交流方面也有幫助。機器人在文字以外,又增加了表情包。機器人可以做自動翻譯,Google 的翻譯就不錯。


機器人在交流領域的新的突破是身體語言。人跟人交流時,除了語言表達以外,還有身體語言。機器人可以捕捉到人的身體語言,譬如姿勢,頭的動作,面部表情,眼睛接觸和手勢等,幫助理解人的意圖。我個人認為,身體語言在中國不是很重視,但是我們確實不可忽視身體語言。


人工智能的發展包括兩個大的領域:軟件方面發展起來的人工智能和硬件方面發展起來的人工智能。


大數據,機器學習都屬於人工智能在軟件方面的發展。


我們這個時代被稱為信息時代並不僅僅是我們有很多數據,而是因為我們在分析數據方面達到了一定的成熟度,從而使得我們可以從數據中提取有用的信息。

谷歌 (Google), 亞馬遜(Amazon),蘋果,臉書和微軟是美國5個市值最高的公司,其主要原因是它們的商業模式都是建立在數據上面。


數據是新時代的石油。石油不能被直接被用來做化工製品,它必須先經過提煉。同樣,數據在使用前,必須做相應的處理。


數據處理可以包括下面的相關步驟:


數據變換(Transforming)。改變數據的面貌。數據變換可以指不同的形式,但是其主要形式就是把數據按矩陣形式排列。譬如,你去商店購物,商店把每個顧客歸在一行,然後每列是購買的物品數量和價格。


數據淨化(Cleansing)。改正不完美的數據。不同的數據收集方法會有不同的數據問題,譬如數據缺失,數據值不合理和錯誤數據等。譬如,網上有的物品和服務評論可能是假的,或者是朋友寫的,或者是競爭對手寫的。根據這些不可靠的數據,可能會得出錯誤的結論。數據淨化就是要把不可靠數據去掉。


數據檢查(Inspecting)。驗證數據。雖然計算機可以在數據分析中起很大作用,但是數據分析很大程度上仍然是人的工作。人很容易識別模式,並發現異常數值,譬如客戶年齡小於10歲或者大於90歲。


數據造型(Modeling)。掌握數據里不同因素的關係。通過統計方法,發現客戶購買不同物品之間的關係。譬如,我們去亞馬遜買東西時,它會推薦相關產品。


數據分析在人工智能領域至關重要。業內人士認為,人工智能直到現在才開始騰飛,其主要原因是數據質量和數據來源的提高。


數據分析的最高層次是機器學習。機器學習的中心思想是,在事先沒有已知算法的情況下,機器通過分析數據,用數學公式表達現實世界。機器學習讓我們可以用未知的數學函數來表達複雜的現實世界。而這個複雜的數學函數,是機器的內部算法通過數據自己學會的。


機器學習過程完全是一個數學邏輯過程。它通過數學形式把輸入和輸出聯繫起來。機器學習完全沒有理解算法學到了什麼東西,而僅僅是內部算法把輸入和輸出建立起一個函數關係。所以,機器學習過程也是一個機器訓練過程。


想象一下我們教孩子學習。我們教孩子認識什麼是樹,然後告訴孩子樹的結構,形狀,並讓孩子看很多樹的圖片,這樣孩子就知道樹是什麼樣的。


機器學習是一個類似的過程。它通過數學公式形式,建立機器的感知能力。機器內部算法記住各種物體的特徵,然後產生辨別物體的能力。


機器的學習能力和人的智力是不一樣的。人們不能期待機器有人的智力並完全具有人的智能。


機器學習的三個主要缺陷:


  1. 表述能力(Representation)。用數學語言表述一個複雜問題是一件困難的事情,特別是要模擬人腦。到目前為此,機器學習只能回答簡單問題,這是什麼?這個多少錢?下一個是什麼?

  2. 過度擬合(overfitting)。機器學習似乎可以學習我們關心的事情,事實上它們不能。機器學習系統只是記住了數據,其實它並沒有理解數據。過度擬合指的是算法從數據中學到了太多關係,而這些關係在現實中是不存在的。經濟學上說,如果一個少胳膊的人跑得快,你不能得出結論,少胳膊可以使人跑得快。

  3. 在數據有限的情況下,機器學習缺少舉一反三的能力(Lack of effective generation because of limited data)。機器只能學會你教它的東西。如果你給機器提供不好的數據,那麼它產生的結果就難以預料。微軟搞了一個對話機器人(Taylor), 它很快就學會了許多髒話。


機器學習的三種主要算法(Machine Learning Algorithms)::


  1. 監督學習 (Supervised Learning)。 監督學習就像我們人類在老師指導下學習。老師給學生舉出有用的例子,學生記住例子並推導出一般規律。統計回歸,數據分類,圖像識別,語音識別,機器翻譯,自動駕駛車等,都是監督學習。

  2. 無監督學習 (Unsupervised Learning)。無監督學習是讓機器從數據中尋找規律,把數據或者物品分類,給人提供意想不到的內在聯繫。我們在網上購物時,有些廣告會彈出來,這就是機器學習的結果,它認為,你對其它相關物品也會感興趣。

  3. 加強學習 (Reinforcement Learning)。加強學習就是給算法提供沒有結論的例子,但是給機器提供正面或者負面的反饋。這跟人類的反覆試驗學習方法一樣。簡單的例子就是計算機學習玩電子遊戲。 Google 的 DeepMind 就是一個加強學習的例子,它剛開始遊戲玩得不好,但是後來變成冠軍。

機器學習的三種主要方法(Three most promising AI learning approaches):


  1. 樸素的貝葉斯 (Naive Bayes)。 這種算法可以比醫生做出更精確的診斷結果。它也可以探測垃圾郵件和文字裡的情緒。這種方法也經常被用來跟蹤互聯網上的大數據傳運。

  2. 貝葉斯網絡 (Bayesian Networks, Graph Form)。 這種圖像可以用概率的形式表示複雜的世界。

  3. 決策樹 (Decision Trees) 。決策樹表現符號最佳。決策樹歷史悠久,它表示了人工智能的決策過程並因此而得名。


人工智能的深度學習。機器學習是人工智能的一部分,深度學習是機器學習的一部分,所以深度學習在人工智能里是一個很小的領域,但是媒體好像特別喜歡關注深度學習。


深度學習是人工智能模仿人的大腦神經系統的學習方法。人的大腦有神經網絡,所以深度學習是用電腦模仿人的神經網絡。


想象一下我們要過濾水,讓水經過一層一層的過濾系統,最後得到乾淨的水。

同樣,深度學習是把輸入數據經過一層一層的信息網,通過一層一層的演算,最後得出結論。我自己的理解,最簡單的神經網絡就是線性回歸,或者邏輯回歸,用戶輸入數據,電腦做回歸,建立輸入和輸出之間的關係。複雜一些的神經網絡,每一層對數據做不同的處理和變換,調整變換的係數和權重,最後產生結果。


我自己的理解,深度學習是一個迭代過程(Backpropagation),每個迭代過程的專業名稱是時代(Epoch)。已知數據被輸入到神經網絡里,網絡調整內部參數,然後擬合最佳結果。過度擬合也容易在這個過程中產生。深度學習的具體過程,我將會另文介紹。



前面我們提到,人工智能包括兩個大的領域,軟件方面的人工智能和硬件方面的人工智能。我們剛介紹了軟件方面的人工智能的發展,下面我們介紹硬件方面人工智能的發展。


很多人把人工智能和機器人混為一談,但是機器人和人工智能是兩回事,雖然這兩者有很多重疊部分。


人工智能是為了像人一樣解決複雜問題,而機器人是在現實世界裡把人的想法自動化。


介紹機器人以前,我們先了解一下機器人的三個規則:


  1. 機器人不可以傷害人,或者通過不作為而使得人遭到傷害(First Law – A robot may not injure a human being or, through inaction, allow a human being to come to harm)

  2. 機器人必須服從人的指令,除非人的指令違背前面的第一條規則(Second Law – A robot must obey the orders given it by human beings except where such orders would conflict with the First Law)

  3. 機器人必須保護它自己的存在,除非這種保護跟前面的第一條或者第二條相衝突(Third Law – A robot must protect its own existence as long as such protection does not conflict with the First or Second Laws)。


現在各種各樣的機器人已經很多,但是大家關心的主要機器人包括無人駕駛飛機和自動行駛的汽車。限於篇幅,這裡只介紹一下自動駕駛汽車。


在神話自動駕駛車以前,我們先看一下自動駕駛車的自動化程度分類。


  1. 給駕駛員提供幫助。車的控制仍然在人手中,但是車可以提供一些簡單的幫助,譬如控制車的速度。其實我們的巡航控制(Cruise Control),和預設剎車系統就是這個功能。

  2. 部分自動駕駛。車更多的時候不需要人的干預。車可以根據路況調整速度,這樣駕駛員只需要保持警惕就可以。自動巡航控制就是這種功能。

  3. 有條件自動駕駛。目前生產中的自動駕駛車基本在這個水平。車可以在特定的路況下自動駕駛,譬如高速公路或者單向行駛的公路。車可以根據路況剎車,人只要關注並在緊急情況下接管駕駛。

  4. 高度自動駕駛。車可以像人一樣轉方向盤,踩油門,剎車,並根據路況從出發點到終點做路況駕駛調整。車的駕駛不需要人的干預,只是在特定的情況下才需要人的操作。人只需要隨車監督就行。預計2020年這樣的車可以上路。

  5. 完全自動駕駛。車可以完全自動駕駛,從出發點到終點,車都不需要人的干預。這樣的車已經沒有方向盤,根本不需要駕駛員。預計2025年這樣的車可以上路。


自動駕駛車可以提供下面的幾個好處。


  1. 很少發生交通事故。因為自動駕駛車嚴格遵從交通規則,所以事故很少發生。因為沒有人駕駛,車的安全保護措施就沒有必要,所以未來的車會很輕,甚至可以用塑料製造車。因為事故少了,車的保險費用也會下降。汽車保險業會受影響。

  2. 人工駕駛的工作減少。自動駕駛車就減少了專職駕駛員的需求。現在美國有300萬人做駕駛工作。

  3. 大家可以節省時間。自動駕駛車可以給大家節省很多駕駛時間。大家可以把開車的時間去做別的事情。


生產自動駕駛車需要很多技術上的突破。


全球定位系統跟蹤監視車在哪裡並規划行車路線。


雷達,超聲和光測儀(Lidar, Light Detection and Ranging) 發現周圍物體和它們的運動情況。


車載相機告訴車周圍的路況,指導車的行動。


不管我們是否喜歡,自動駕駛車會進入我們的生活。未來要麼我們使用自動駕駛車,要麼我們跟自動駕駛車共享馬路。


在結束此文以前,讓我簡單歸納一下人工智能的未來。


人工智能的缺陷是它沒有創造性,不能想象未來,也不會有原創性的想法。人工智能不會有情緒,也不會有內疚感。


人工智能的發展,要考慮下面現實世界的要求:


  1. 經濟合算。人們在購買人工智能的應用以前,要看它是否比現在的現有應用合算。沒有經濟效益的應用就沒有前途。譬如,炒菜機器人是不是比人工炒菜便宜。

  2. 可重複性。人們期待人工智能的結果是可以重複的。這對現有的步驟性方法很容易,但是對有塑造性的人工智能應用卻是一個挑戰。每次機器人炒出來的菜質量是不是可靠。

  3. 高效。經濟規律要求在最少資源的情況下取得最好的結果。機器人削蘋果時,是不是浪費太多。

  4. 有效。人工智能應用要提供人們需要的結果。送貨機器人是否確實把物品送到。

  5. 實用。所有的人工智能應用必須給人們提供實質性幫助。機器人護理是不是確實給病人提供幫助。


現在人工智能很熱,但是我們要警惕人工智能的冬天(AI Winter)。人們在開發人工智能的應用時,容易承諾過度,到時候卻實現不了。這種過度樂觀,最後會讓投資者失望。人工智能的冬天以前發生過,以後仍然會發生。



0%(0)
0%(0)
  讚一個!很好的總結性科普, 多謝  /無內容 - 五十肩 02/27/19 (449)
標 題 (必選項):
內 容 (選填項):
實用資訊
回國機票$360起 | 商務艙省$200 | 全球最佳航空公司出爐:海航獲五星
海外華人福利!在線看陳建斌《三叉戟》熱血歸回 豪情築夢 高清免費看 無地區限制
一周點擊熱帖 更多>>
一周回復熱帖
歷史上的今天:回復熱帖
2018: 十年鑄劍,精至鴛鴦
2018: 腎移植中的新技術-- 離體腎體溫下的灌
2017: 文化沉思錄(50)
2017: 中軍:川普為啥好挨悶棍
2016: 不看這216個字,不知中華書法之俊美
2015: 一組圖告訴你中美高中生的差別!
2015: 密碼的秘密:經典加密方法均已失效(組
2014: 與加州共ZT:和黨最高層的直接接觸, 共
2014: 風中的承諾(十四)辦公室的血腥