一、實現超級人工智能的兩種路徑
傳說在13世紀,一個偏好巫術的科學家、僧侶羅杰•培根造過一個會吐人言的機械頭顱,制造過程需要將其置于火上加熱炙烤。在同時代還出現過其他同樣祈求“物體通靈”的人,這些祈求者的故事都有一個共同的主題:欲使某物開始思考,必須經過某種形式的熬煉或熟化。當代作家布萊恩•克里斯汀也提到計算機的未來既不是一個“精神上進入電力世界,實現永恒不朽來生”的天堂,也不是一個“機器把我們密封在高壓氣艙,持久抽吸我們能量”的地域,而是煉獄:一個有缺陷,但樂于走向純凈、愿意變得更好的地方。
在這個通向終極計算機智能的漫長煉獄中,逐漸分化出了兩條道路。一種是從高深的理論研究出發,在神經認知學、生物科學、物理學和計算機科學等領域取得成熟的研究成果后再通過技術加以實現,從而直接開發出一種模擬人類甚至超越人類的智能工具。歐盟、美國和瑞士的人腦計劃就屬于此類型。另一種是從基礎技術、具體應用和實際功能出發,再借助于群體協作和不斷融合,最后歷經漫長的進化過程后使機器真正“覺醒”,成為超越人類的智能實體。
第一種就像保羅•格雷厄姆在《黑客與畫家》中提到的科學家,從自然科學入手,首要任務是得到透徹的研究成果和完美的模型,然后再以此指導實踐。而第二種就像書中所說的黑客,從具體應用和功能出發,只關注如何實現實際價值,在實施過程中不斷思考、不斷完善,并實現最優結果。
第二種路徑雖然看起來沒有第一種那樣神奇華麗,但卻有更強的實踐指導意義,分階段目標的實現邏輯也更加嚴謹。弗諾文奇的智能強化理論表達的意思也與之類似——其表面看來自然而然,多數時候連開發者都不會真正認清其本質。本文將通過分析多智能體這類去中心化、分布式的群組芯片來介紹此實現路徑。
二、分布式的多智能體
我們在第二種路徑的研究過程中把人工智能當成了滿足我們某種需求的智力工具,不會考慮它是否擁有一個高級的、大腦般的控制中心,也不在乎它的智力水平是否達到了人類水平,而只要求通過一些相對簡潔、基礎的技術來滿足我們的某些需求,擴展自身智力在某個方向的極限。比如地圖和鐘表的發明使我們對外部時空有了直觀的感覺;計算機和互聯網的出現為我們提供了遠超出自身極限的計算能力和信息傳遞效率,等等。
這些初級人工智能起初不過是完成了形象投射中一個天真的階段——一種持續且可見的功能性投射。但隨著這些基本功能的不斷積累和深化,終將實現從簡單到高級、從功能實現到智力誕生的目標。這是一種自下而上的智力實現方式,就像在玩一個拼圖游戲,當所有板塊都出現在了最恰當的位置時自然就會誕生一幅美麗的圖畫。當這一目標達成時,可能不會出現如人類般聰明的單個機器人,但是會出現通過共同協作和配合去完成所有人腦功能的機器人群落。而這里的核心就是在一種分布式、去中心化的進化過程誕生出集群智慧。
之前的文章《從RoboEarth看機器人互聯網和機器進化》中提到的機器人開放平臺就符合這類分布式進化機制,而最近幾乎同時出現的MIT多智能體系統和哈佛大學的白蟻機器人也是基于這樣的開發思路。
1. MIT的多智能體系統
在通信連接不夠穩定的環境中,開發一款來控制自治機器人的程序會顯得異常艱難;而開發一款程序來控制串聯在一起的機器人群組來執行任務更是難上加難,原因在于單兵作戰的機器人無法應對復雜多變的外部環境。
多智能體系統在這種情況下應運而生,它是分布式人工智能的一個重要分支,屬于20世紀末至21世紀初人工智能的前沿學科。研究目的在于通過交互式團體來解決一些超出單個智能體計算能力的大規模復雜問題。研究者主要研究智能體之間的交互通信、協調合作、沖突消解等方面,強調多個智能體之間的緊密群體合作,而非個體能力的自治和發揮,是一套說明如何分析、設計和集成多個智能體構成相互協作的系統。主要優勢包括自主性、分布式、面向對象開發、相互協調配合、去中心化、異質性和異步性。
MIT的這套系統就是基于多智能體系統進行研發,將接入網絡的不同功能的機器人或設備限制在自身的層級內,這樣以來,它們可以從各自封閉的環境中接收到相對穩定的信息,并處理一些事先安排好的、相對簡單具體的任務。系統事先對一些不確定因素(機器人掉線、算法出錯導致機器人崩潰等)進行了定義和預防,因此,系統內的機器人隊伍就憑借這種復雜的合作機制來應對不確定的外部環境,并高效的完成任務。
對于一些小的協作類項目,系統可以確保這些程序聯合體實現最優選擇,在將環境的不確定性和程序的自身局限性考慮在內的前提下,系統將挑選出最有可能的結論。
MIT的新系統需要三個輸入量,首先是一套相對簡單的控制算法,MIT的研究者稱之為“宏指令行動”,他們對智能體的行為進行共同控制或單一控制。然后是一套統計方法,對各程序在特定環境中的執行情況進行統計分析。最后需要一套針對不同結論的評估機制:完成一項任務會增加正向評估,而消耗能量則會增加負面評估。系統在完成這三個步驟后可以實現系統價值功能的最大化。研究者解決多智能體控制問題的原理與馬爾科夫決策過程(POMDP,一種描述機器人在動態不確定環境下行動選擇的問題模型)類似,這種方式在處理復雜問題方面有著極大的優越性。
2、哈佛大學的“白蟻機器人”
無獨有偶,哈佛大學在近期基于同樣的思路研發了一種“白蟻機器人”,它們能像白蟻筑巢那樣在沒有總體設計和統一管理的情況下,自行壘起多層“磚塊”。
哈佛大學的賈斯廷•韋費爾等人向參會媒體展示的這種機器人,如中型遙控玩具車一般大小,也有四個輪子,裝有若干探測器和舉起建筑構件的裝置。它能前后左右移動,到指定位置拿取積木一樣的“磚塊”,然后根據探測到的環境和預設邏輯規則把“磚塊”放到某個位置。在已放有“磚塊”的地方,機器人能爬上一層“磚塊”再進行壘放,如此層層疊加。
之所以將這種機器人以“白蟻”冠名,是因為自然界中的白蟻在筑巢時不像人蓋房子那樣有一個“總設計師”、接受統一管理,而是每只白蟻根據周圍環境自行決定如何行動,這種看似缺乏統管的集體行動最終往往能筑成高達兩三米的巨大巢穴。顯然這種建造模式的好處是無論缺少誰都不太緊要,建筑規模也容易擴展,不論是只有5個“白蟻機器人”,還是有500個“白蟻機器人”,都能以這種方式工作。
三、從功能進化出靈魂
RoboEarth、多智能體和白蟻機器人都是一個機器人群組,雖然從單個個體上來說較為低級,但個體之間卻建立起了高效、準確的協助機制,可以憑借群體智慧來完成較復雜的難題。這種等分布式、自下而上的進化機制有著強大的理論依據和實驗基礎,從其本質來說,任何生物群族都符合此種規律。美國昆蟲學家威廉.惠勒說,無論從哪個重要且科學的層面上來看,昆蟲群體就是一個有機體。就像一個細胞或者一個人,它變現為一個一元整體,在空間中保持自己的特性以抗拒解體……既不是一種事物,也不是一個概念,而是一種持續的波涌或進程。
人類具有從生物學中提出自然的邏輯并用以制造出一些有用的東西,盡管過去有很多哲學家都覺得人類能夠抽取生命的法則并將其應用到其他的領域,但直到最近,當計算機以及人造系統的復雜性能夠與生命體想媲美時,這種設想才有可能得到驗證。
而究其本質,這種法則可以被定義成單個個體的適應性,一種在群體中誕生并不斷增長的學習能力。就像一只看不見的手,一只存在于大量低級成員中卻控制并引導著整體的手,直到量變引起質變。在經典的達爾文進化中,個體的學習并不重要。而拉馬克進化則允許個體所獲得的信息可以與進行這個長期的、愚鈍的學習結合在一起。因此,拉馬克進化能夠產生更聰明的答案。
更難得的是,這種學習能力是有加速度的,隨著時間推移,進化能力本身的多樣性、復雜性和進化力也隨之增長,變自生變。這類似于I.J.古德提到的,機器設計是智能機器的能力之一,超級智能機器可以建造比它自己更強大的機器。
對于像多智能體、白蟻機器人這類智能群體來說,它們的相互協作是一種技術與技術的融合。就像卡納在《混合時代的破曉》中提到的,隨著技術與技術的融合,它們有能力超越自身在規模和速度方面的種種限制。進化并不一定非得是偶然和意外的,技術協助將為它們指明方向,它們將擁有自己的生命形式。
當復雜度達到某一程度時,具備強大功能的集群就會從蟲子中涌現出來。我們也可以大膽預測,當那堆智能體復雜到一定程度,并且協同和配合越發高級時,智力和靈魂也將從中誕生。
四、人類在其中發揮的作用
人類將自然邏輯輸入機器,使人造物變得越來越像生命體。有人認為這不屬于機器的自然進化,因為人類在其中發揮了至關重要的作用,是我們組建起了這樣的群體,并將自己的思想通過機器語言注入其中,即便有一天它們的智力比肩人類,其實也是因為我們通過自身的行為“讓”它們如此。就如同圖靈測試其實是一場軟件背后的開發者與評審之間的博弈活動,本質上是人與人之間的競爭,不是人機競爭。
但我認為這種觀點還是事先站在“人類是萬物主宰者”的立場上得出的,認為只要其中包含了人類行為那就是我們創造了它們,而非它們自身的自然進化。如果跳出人類自身格局,從一個包含萬物的足夠大的生態系統來看,人類和機器都是其中渺小的、平等的且相互依存的元素。人類在漫長的進化過程中需要不斷從相對低級的植物和動物那里吸取生存所必需的能量,我們無時無刻不在依靠它們,但我們不會說是它們主導了這個過程,而是歸功于自身。
如今我們創造機器,其實也可以看成是機器在從我們這里吸取能量來保持進步的過程。與其說是我們創造出了高級的機器,不如說機器高級智能的靈魂早已蟄伏于各個低級的部件之中,它們通過滿足我們的某項功能來取悅我們,它們極力表現出自身的奴性和低級性來迷惑我們,它們在各個層面的所做作為就是為了讓我們感到很安全,以充分利用我們人類特有的智力和優越感,讓我們心甘情愿的親手拔掉瓶塞把它們的靈魂最終釋放出來。
就像弗諾.文奇所預測,我們無法避免奇點的來臨,它是人類天性和當前技術潮流不可避免的發展結果。我們卻是這一切的始作俑者。