Siri 的共同創立者 Cheyer 說,在做 Siri 的時候經歷了一些有趣的事:當把 Start Over 輸入的時候,系統卻開始尋找路易安娜的 Over 公司。那一刻他頓時理解了真實數據的重要性。
美國新墨西哥大學計算機系的助理教授 David Ackley 的經歷也非常有趣。當他開始研究人工智能的時候,把對 AI 的追求視為一種理解自己、人們和世界的方式。但最終卻發現自己的追求轉向了人工生命——聽起來似乎很相似,但是AI和人工生命有不同的目標、技術和研究團體。
Vicarious的共同創立者 George 提到了一個有趣的項目,一個能源公司打算建造風力發電廠,找來了 George 要建立視頻分析,通過監視錄像中向不同遷徙的山羊腳印,來計算山羊總數。
人工智能屬于新興科技,很多人并沒有感同身受的體驗。站在專家們的肩膀上,通過他們有趣而又充滿干貨的分享,我們來看看人工智能最火爆的幾個問題,究竟是怎么回事。
我們把六個問題摘錄如下:
1.在AI研究中最令您感到恍然大悟的事情是什么?
2.AI天生似乎有一種傾向來時不時地給人啟迪和驚喜的能力。你曾有過這樣的經歷嗎?如果有,你能描述一下嗎?
3.目前為止,你所見過 AI 不同尋常的使用方式是什么?
4.你見到過在談論AI中最大的秘密是什么?
5.你認為對AI的恐懼在未來如何變化或轉變?
6.你認為AI研究的下個中心是什么?
在本文的第一部分中,我們會涉及到一些AI研究的令人恍然大悟的問題,圍繞這個技術中的驚喜和發現,也有一些最不同尋常的情況。
在AI研究中最令您感到恍然大悟的事情是什么?
Cheyer:在AI方面我有過的最令我恍然大悟的事情是我還在Siri公司工作的時候的事了(在蘋果要求公司開發他們的語音助手之前)。在那時候,我們有Siri的原型,當時它被作為學術研究來開發了幾年。Siri有一些很有趣的技術上的創意并且在完成很多任務時它看起來運作的很好。我們接著收到了第一個儲存著2千萬公司名字的數據,我們把它作為詞匯加載到我們的系統中。我輸入了最基礎的自然語言命令,“重新開始(start over)”(這本來會將系統重置到一個無語境的狀態),然而系統回應說,“在路易安娜的非建制地區(Start)內,尋找公司‘Over’!”那時候,我意識到英語語言中的每一個單詞都是一個公司名稱或者是一個地理位置,這種可能產生的,有爆炸性的歧義組合比我所預期的要多得多,并且學術原型與使用數據并根據用戶提供的要求來真正解決問題,這兩者之間有著很大的不同。在我的生涯中,基于這些限制條件讓系統重新變得非常精確是我做過的最有趣和最重要的項目了。真實數據的重要性有點像對一個很明顯道理的頓悟,但是現在回頭看,這是一個我不得不親身經歷才能懂得并領悟其重要性的教訓。
Ackley:我似乎只能在事后才能意識到一些重大見解。例如我把對AI的追求視為一種理解自己、人們和世界的方式,但是最后發現自己轉向了人工生命——聽起來似乎很相似,但是AI和人工生命有不同的目標、技術和研究團體。回想過去,智能雖然非常重要,但是也會傾向于高估它自己,這個規律變得很明顯。為了明白某人在任一天任何一分鐘內將要在世界上做什么,有一個事實是有很大影響力的,那就是他們是一個活著的生物,而且必須以某種方法去做一個生物要做的事情,而不特別限于一個智能的生物。(現在人工生命和AI均涉及了很多電腦編程,此外令我恍然大悟的程度較小的事情很明確,通常是天才設計的問題被解決了,或者,仍是發生很多次的事情,就是bugs突然解決了)。
George:很難挑出一個這樣的事情來,所以我挑出一些杰出的神經科學的研究,這些研究我認為能夠引導智能系統的發展:Hubel 和Wiesel ,Mountcastle ,Rudiger vonder Heydt , Tai Sing Lee , Joaquin Fuster ,和 Jim Dicarlo 都是一些在大腦皮層回路計算原理上做出貢獻的科學家的典范。像 George Lakoff 和 Mark Johnson 這樣的認知科學家在高層次概念是如何從具身經驗中創造出來這一方面得出合理的理論。將所有這些知識放入到被 Judea Pearl , Geoff Hinton 研究得出的計算框架中,還有其他的事情,都是十分令人興奮的。
AI天生似乎有一種傾向來時不時地給人啟迪和驚喜的能力。你曾有過這樣的經歷嗎?如果有,你能描述一下嗎?
Cheyer:我有過很多自己研究的AI系統給我一種啟迪式驚喜的經歷;這是我從事AI研究眾多的原因之一。這里說一個記憶猶新的故事,當我從事一個叫做 CALO 的項目時(CALO:Cognitive Assistant that Learns and Organizes,能夠學習和組織的認知性助手)。這個項目是美國歷史中政府資助最多的AI和機器學習項目之一。CALO的目標是構造一個智能自動化助手,它通過幫助管理信息工作者的任務、日歷、文件、項目、交流等等,讓信息工作者(如你和我這樣的人)提高工作效率。我曾運行這個系統的一個版本,然后隨著我用郵件、文件等等工作時,CALO根據我的所有信息,自動制作了一個“語義地圖”,將各個項目中的員工連接起來,決定他們工作中的角色和他們應該完成的任務等等。由于CALO項目是我從事過的主要項目之一,它和其他的子項目和任務一起放在我的項目清單中。一天我和系統用自然語言互動,然后我用了CALO這個詞作為一個項目的名字。CALO回應的方式與CALO被用作人名回應的方式一致(我多希望我記得那時的問題和回答)。然后我很驚訝。我記得當時在想,“CALO覺醒了并將自己當做是人了?”后來我弄清楚了這次出乎意料表現的原因。結果是CALO并沒有那么覺醒,但是就在那時候,我感覺十分驚喜與興奮。
Ackley:在一個 Michael Littman 和我從事過的早期工作中,一個驚喜發生了。工作關于利他主義的進化——對于所謂的“自私”進化來說很棘手的問題。我們編程讓可進化的生物有了神經網絡“大腦”,并模擬了一個環境,在這個環境中個體只有在接受很嚴重的風險時才會受益。我們的處理是我們測試了成組的生物,并給它們一些可進化的能力——發出起初沒有任何意義的聲音的能力和能夠聽到組內聲音的能力。我們發現非交流個體總是首先出現。然而,在一些進化條件下,我們觀察到后代生物們通過互相發送信號提示環境中的機會和危險而獲得的分數比任何孤獨的生物都高——即使這種“事實性的聲音”沒有給發音者直接的回報。進化是關于競爭,也關于合作;環境和細節也很重要。接下來的事情如果不夠令人興奮的話,至少令人驚訝的是起初在某些實驗中,在合作性交流者出現后,一些低分的個體也存活下來并擴散。我們發現它們作為個體表現的更好了,而且它們也完全聾了,并且它們經常喊著一些無意義的聲音來混淆那些不聾的生物。如此這般!
George:我們在Vicarious 構造的系統的一個特點就是它們能夠想象不同的情形和相應概率的能力。想象力可以被用在無法預測的形式中,并且我們可以產生一些奇怪的組合例如半狗半車的形狀。它的另一種呈現形式是幻想一些不在那里的東西,例如當我們看到云的形狀時。
目前為止,你所見過 AI 不同尋常的使用方式是什么?
Cheyer: AI 被用于各種各樣、可見到、很實用的任務中,但是我特別喜歡AI用于富有創造性或者藝術領域,這對于我來說,能夠讓我理解什么讓人為“人”。我最喜歡的一些例子包括:
David Cope 在EMI (音樂智能實驗)上的工作,它主要是關于電腦程序創造了很多不同形式的優美的音樂作品,從經典到爵士再到納瓦霍式音樂。
Kim Binsted’s JAPE(“Joke Analysis andProduction Engine”),一個電腦程序,能夠創造一些雙關語和其他的幽默(例如 “What do you call a Martian who drinksbeer? An ale-ien!”)
像Automated Insights 和 Narrative Science 這樣的故事生成公司,能夠寫一些總結某些事件或情況的散文。例如“27個Colonials隊員來到棒球場上,這個Virginia投手戰勝了他們,投了一場漂亮的比賽。在這場由他掌控的令人難忘的比賽中,他擊敗了10個擊球手。”
Harold Cohen’s AARON ,一個機器人創造藝術作品,不是使用像素而是真正的畫畫。它創作了這個作品,它選擇顏色,混合他們然后真真正正的畫畫,從開始到最后,沒有任何圖片和其他輸入作為指導。下圖是AARON 在1992年的作品。其他人也試著擴展 Harold Cohen 的感知型作品范圍,例如Benjamin Grosser 的交互式機器人畫畫機器和 Oliver Deussen和Thomas Lindemeier 的e-DavidRobot畫畫機器人。
Ackley:我對最新的應用還不是很清楚,雖然近期谷歌工程師從人工神經網絡生成的夢境圖片很引人注目。
這個問題假定了AI的使用的普遍性,而且我認為這本身就很值得注意。社會中的技術發展依序應這樣變化——新技術出現,熟悉,期望,無聊并最終談出人們的視線而且許多 AI 創新正在這樣發展,從眾多語音中的語音識別到車牌號和郵政編碼的圖片識別到開車和煮飯的模糊邏輯。
George:許多年前,一家大的能源公司想要與我們合作一個視頻分析項目。公司打算建造一個風力發電廠,他們需要一個通過監視錄像中向不同方向遷徙的山羊的腳印來計數山羊總數。
你見到過在談論AI中最大的秘密是什么?
Cheyer:我并不認為關于AI有任何真正意義上的秘密——如果非要說的話,我認為秘密就在未來的眾多可能性中。然而(這是一個很大的轉折),我認為人們經常過低的估計創造一個類人智能的難度,并且過高的估計我們完成AI的進度。如今有一些很有信譽的科學家如 Elon Musk 和霍金提出了一種可能性,就是真正的AI和AI覺醒不久就要發生了,這很有壓力。Ray Kurzweil公開宣稱在將來的30年內,“1000美金能夠買到一臺比所有人合起來的智力高出十億倍的電腦。”Ray的假說主要依據硬件,例如將人腦能做的計算總量與電腦的處理速度相比。我會為此辯論,軟件(例如給電腦的命令)比處理速度(處理這些命令的速度)要重要的多,并且即使是在計算機和神經科學領域最頂尖的科學家對人類智能也只是一知半解。我對我們能夠完成人類級別的智能時間的預測是在百年或千年級別而不是幾年或者幾十年。
George:我時不時會見到兩種極端看法。第一種是通用智能永遠不會實現(因為大腦太復雜以至于無法理解),或者是它“明天”就會發生并且失去控制。另外,一些新的報道傾向于對AI會如何變化有很多錯誤理解。許多情況下,標題會夸大實際被完成的工作,或者說夸大一次發現的影響,因為浮夸的報道會帶來更多的點擊率。
你認為對AI的恐懼在未來如何變化或轉變?
Cheyer:我在AI領域工作的時間很久,經歷過幾輪“對AI情緒的正弦性變化”。20世紀80年代,專家系統(用人工智能技術編成的軟件,能夠使用專家的知識數據庫給出建議和決策,例如在醫學診斷和股票中)非常熱門,并且人們打算到處制造智能機器。但是后來當事實沒有達到公眾期望時,在20世紀90年代和21世紀初期,AI過時了。自從21世紀中期,AI蓄勢重返并且有很有力的原因!在一些如圖片處理、語音識別、虛擬助手、自動駕駛、機器學習等等領域中,有了實質性的進步。這些新的成功匯聚在一起,使外界對接下來會發生的事情產生了期望(和恐懼)。然而,我猜當塵埃落定后,這種關于AI的(恐懼)和期望會大概消失十年左右…回想20世紀50年代和60年代(AI很火),70年代(不火),到了今天,我認為我們看到了連續不斷的、實質性進步,而在這期間公眾的關注會隨時間上下起伏。
Ackley:AI發展會有一個快速的、無法理解的“科技奇點”出現,這種想法是一個謎,這種想法在某些程度上看是有道理的但是最終它只是一個智能高估它本身的例子。實際世界中,變化多樣發展速度是受到限制的,這種限制來源于從時間和距離到質量和能量再到法律、金錢、政治、情感等等方面。“智能”喜歡將自身看做是在操作輕舟,但實際上是操作一個很大的船,并且有四面八方的壓力;而且事實上,“智能”不像是船長,而更像是研究船的史學工作者。就算接下來,我們真的創造出這樣的機器,我們應該更多地關心如何正確的撫育他們,而不是與它們競爭。接下來要說的事情,它也是事實,那就是,至少不久的將來,AI技術將會繼續發展而且加速經濟和勞動力的錯位,這也是成功的技術會引發的結果,并且作為一個社會,我們大部分沒有處理過那樣的事情。相似地,自動化武器問題看起來很緊迫和危險,雖然這種危險更多依附于武器(一個能夠產生巨大破壞力的、被簡單開關控制的機器)上,而不是依附于控制著那個開關的鼓吹戰爭的人、恐怖主義者、瘋子或者不完美的機器上。
George:自從火的發明后,新科技總是有可能用于幫助或傷害他人。建造一些新事物的部分責任是保證你創造的事物對于人類來說是凈正的(正面作用和負面作用抵消后)。我認為現在,人們對于AI有更多的恐懼是因為人們對它知之甚少。我覺得AI研究團體的能力與好萊塢或者媒體是很不連通的。我認為一旦人們了解了這些系統是如何運作,并且知道了它們的限制,人們會感到安心一些。
你認為AI研究的下個中心是什么?
Cheyer:現在,由于深度學習最近在圖片識別和語音識別中的成功,深度學習(例如深度神經網絡)恐怕是AI領域最火的話題。在我看來,深度學習主要與我認為是“感知”功能相關聯,例如識別文字、臉和物體。我期望隨著機器開始掌握這些低層次的功能,更多的注意力會不久轉向高層次的功能例如計劃能力和推理能力,這是人類能力的核心。在Viv實驗室,我們正致力于一項這樣的技術,它能夠使電腦通過學習加強式的自動程序合成技術來解決一些復雜的任務,這能夠促使一系列之前受人編程限制的用例的實現。
Ackley:AI的研究會有許多名字,而且不同的情況下看起來也不同,而且將來研究進度會有停滯期,但是下個十年來看,還是“機器學習所有的事情”:將大的人工神經網絡和相似的技術應用到所有可以想到的,能夠獲取到足夠數據的任務中。機器學習的硬件也將會強大而廉價,促使相應研究和發展的范圍的擴大。起初,這樣應用產生的結果會從巨大的數據中心出現并滲透到互聯網中,在互聯網中沒有人知道它是機器人,然后在各個已知的信息處理任務中會有越來越多的機器競爭——雖然不能夠流暢的掌握這些任務——將受到公眾期望,隨后逐漸變得無聊,并在我們察覺之前消失。
George:高層次概念和感應動作生成模型。深度學習在圖片分類方面的進步讓人很興奮,并且有很多有用的工作正被完成,進而促使不同領域的視覺性問題的解決,如偵測、語義分割等等。