作者試圖分析兩個問題:如果要研究由非合作博弈發展出合作的可能性,什麼樣的理論實驗博弈的設計才是合理和普遍有效的;什麼是最可能形成合作的條件。其中以羅爾斯、艾克斯羅德和哈貝馬斯的設想作為具體分析案例,分別指出這些方案在遊戲設計上存在著不合理的遊戲條件,從而導致對合作的錯誤理解。最後,作者改造了中國關於和諧的傳統概念,提出一種比帕累託改進更有利於形成合作的“孔子改進”。
本文原載《世界經濟與政治》2007年第6期,原題為“衝突、合作與和諧的博弈哲學”。
一、初始狀態作為政治起點
在解決衝突的研究中,政治學家往往不太喜歡哲學家對道德意義的誇大,因為道德行為必須同時是具有博弈優勢的生存行為,才是可行的,否則是可疑的。正如賓默爾指出的:哲學家喜歡研究對生活問題的道德解決,並把道德想象成康德式的理性先驗絕對命令,貌似人們必須這麼做,但事實是,道德遊戲終究必須同時是生存遊戲,否則根本行不通[1]。這意味著,如果道德原則在生存博弈中是無效率的,那就是壞的原則。以現實主義的冷靜態度去解釋道德的思路並不新。荀子早就對“禮起於何也”的問題給出了在今天看來屬於政治學和經濟學的解釋:禮這種倫理-政治制度安排是為了克服無節制的“爭”所引起的亂和窮[2]。這與後來以“一切人對一切人的戰爭”而聞名的霍布斯“叢林”思路在很大程度上異曲同工,而且互補。荀子和霍布斯的分析都是從一種假設的初始狀態去分析合作的條件以及合作規則的生成。初始狀態問題後來由於羅爾斯在《正義論》中的傑出工作而成為當代政治哲學和倫理學的一個熱點問題。
初始狀態是一個尚未存在共同承認的遊戲規則情況下的特殊遊戲,人們在自由選擇中逐步形成遊戲規則,可以說,初始遊戲是在無限制的策略選擇中進行的,沒有什麼是非法的或道德上不允許的。既然每個博弈方都享有最大化的自由選擇,就必定暴露出“前道德的”真面目,在充分自由的條件下去做他最想做的事情,包括殺人放火,而任何一個人的唯一限制就是他人的選擇。任何人的選擇都不得不受到他人選擇的制約,這是分析人與他人關係最徹底的理論環境,所有的規則和制度都將在人與他人的互相互動制約關係中產生。由於規則和制度的有效性在於穩定性,至少是比較穩定的,因此需要關心的是,什麼樣的人際關係能夠生成或導致穩定的規則和制度。
初始狀態雖是理論虛構,但對於說明真實生活仍然必須是真實有效的,不能是文學故事。這裡的“有效性”至少包括兩個要求:(1)虛構的初始遊戲原理與真實的生活遊戲之間必須是可通達的或可過渡的,大致能夠反映真實生活的思維方式和策略選擇模式;(2)作為思想實驗的初始遊戲所發現的普遍原理往往表達了比真實情況更正確的博弈選擇,這是因為,真實博弈有許多偶然因素或“噪音”,也就可能使人們做出感情衝動或一時糊塗的錯誤選擇,就是說實驗博弈可以最大程度地接近理性最優。不過,純粹理論追求的“比真實更正確”理想其實多少有些荒謬:理論或許更正確(理性上正確),但人們在生活中所真正追求的未必是那些所謂最正確的事情,因為沒有充分理由能夠證明“正確的”就是“更好的”,錯誤的行為或許創造了豐富多彩的歷史和也許更值得一過的生活,許多人寧願要“錯誤的”生活(比如為愛情或民族犧牲生命)。這就像真實世界中不存在嚴格的直線,人們卻未必就認為嚴格的直線比不太直的線更好。但無論如何,理論上的直線對真實而不太直的直線仍然具有說明力。作為理論實驗的遊戲就是試圖發現比真實更正確的選擇以便建立對生活的普遍理解,這也是理想和烏托邦的意義所在。
人們設想了多種初始狀態。霍布斯的“自然狀態”可能是最知名的初始狀態。比霍布斯更古老的荀子初始狀態有著精神相通而甚至更深刻的設想,這是我們在後面要重點分析的問題。這裡先排除一些真實度不高的知名想象,例如《禮記/禮運》相信早期社會是充分合作的“大同”社會,後來才變成私心壓倒公心的“小康”社會,這是一種退化論。馬克思主義的想象則與《禮記》有某些相似,也相信在導致私心和衝突之前有過原始共產主義。盧梭相信自然狀態中人們雖有著自然的不平等(體力和智力),但不足以導致霍布斯想象的普遍殘酷衝突,因為那時還沒有什麼值得爭奪乃至拼命的東西,直到後來出現“萬惡的私產”才有了可搶可盜的物品。但盧梭肯定想錯了,食物優先權和交配權即使在動物界也是你死我活的問題。這些設想都非常有趣,但恐怕都不很真實,歷史上真實的初始狀態更可能是群體之間的殘酷衝突以及群體內部的合作與競爭並存。可是,為什麼不選擇真實的初始狀態作為理論分析對象?秘密在於,真實狀態不夠極端,沒有觸及社會可能變化的最差極限狀態,因此反而漏掉了一些可能性而不具充分普遍的說明力。人類真實歷史的運氣不算太差,還沒有遭遇最可怕的情況(比如核大戰),但最恐怖的情況是有可能發生的,所以理論必須要把任何可能性算計在內。
無論是設想一開始就是衝突(霍布斯),還是先有合作後來變成衝突(荀子),都同樣把需要解決的核心問題落實在“衝突”上,因此,根本問題就是:在衝突條件下如何能夠產生穩定的合作?或者說,給定人人自私,合作是如何可能的?並且,什麼才是眾望所歸的合作原則?初始遊戲不需要真實的歷史起點,但必須是有效的理論起點。這個有效的理論起點必須足夠差,在效果上接近最差可能世界,因此只能是“人人都只為自己著想”的利益衝突狀態,只有這樣才能夠清楚地表達出需要解決的全部社會問題。假如“人人為別人著想”,人們所煩惱的絕大多數問題就不復存在了,也就不需要反思了。因此,任何一個實驗性的初始狀態所要分析的都是在私心主導的環境中如何形成合作的問題。荀子–霍布斯方案最為簡潔:不僅人人自私,而且不擇手段。“不擇手段”是個真正嚴重的挑戰,當代理論家們往往回避這一經典困難,而選擇了比較溫和的羅爾斯方案。這種避重就輕、掩蓋問題的做法或許有撫慰心靈(尤其是知識分子的軟弱心靈)的功能,但在事實上和理論上都是錯誤的。
二、羅爾斯方案的疑問
任何社會契約都有著特定的社會條件和時代背景,不存在普遍通用的社會契約,在特殊背景下形成的社會契約未必是公正的,事實上往往不公正。羅爾斯引入“無知之幕”這樣一種人為設計的博弈條件,就是試圖製造一個完全平等的處境,以便考察人們僅憑理性能夠做出的真正公平的選擇。在羅爾斯的初始狀態中的博弈各方都是自私的,完全無視別人利益,又都是充分理性的,尤其還處於“無知之幕”這個“完全公平的”博弈環境中,人人對自身狀況一無所知,不知道自己與他人在各方面的差異,甚至不知道自己所處的社會和時代[3],相當於既不知己又不知彼,甚至不知“魏晉”。正是因為無知之幕屏蔽了一切信息,羅爾斯相信,此種人為製造的完全公平處境就能夠必然地形成人們一致同意的選擇。全體一致同意(unanimous)的事情顯然是最合法的公共選擇,也是完美的民主結果,儘管未必是最優的公共選擇(一致同意的蠢事也可能發生),這一點在此不論。這裡要討論的是,羅爾斯的著名設計雖然水平很高,卻有許多疑點。
首先,在博弈條件的設計上,博弈方被假定為只有思維(mind)而沒有心(heart),這種理解在單純經濟學中或許合適,但對於解釋社會、政治和生活則是嚴重缺陷。社會中許多根本性的衝突是心的衝突(信仰、精神、情感和價值觀的衝突)而遠不僅是利益衝突,而且沒有理由證明物質利益比精神價值更重要。羅爾斯在規定“人人都需要的”基本物品時就忽視了宗教信仰或精神需要,這對於人和生活實況都是歪曲,因為生活根本不是那樣的活法。僅從理性和物質利益去理解的社會太過單調,以至於無法由此辨認出是一個實際上可能的人的社會。單這並非羅爾斯的個人錯誤,而是現代學術的流行錯誤。
“無知之幕”確實獨具匠心,但無知狀態的博弈與有知狀態的博弈之間有著無法過渡或無法兌換的鴻溝,因為它們已經是本質不同的世界,是兩種世界而不是一個世界的兩種情況,由此無法互相兌換或轉換,這一點也明顯地限制了無知之幕模型對真實世界的說明力。任何真實的社會博弈都是某種程度的有知狀態,而且人們拼命追求有知狀態,因此任何社會都以有知狀態為目標,人們必須知道自己有什麼需要保護、有什麼值得爭奪、以及是否有條件去爭取自己想要的東西,總之不能盲目地選擇,盲目選擇的遊戲也許可以進行,但是無意義。進一步說,人們也不可能不知道一個遊戲是什麼樣的就盲目同意參加遊戲,那樣未免太冒險了,除非是被強迫參加遊戲。當然,羅爾斯需要一個充分公平的博弈環境,這個心情可以理解。自然差異無法改變,弱者對於強者無力以抗,於是羅爾斯想用“無知之幕”來讓自然差異暫時失效,這樣人們在絕對黑暗中就只好選擇一個公平的社會契約,以免自己萬一吃大虧。這是個讓人佩服的想象,只可惜存在著一些難以克服的嚴重困難。
其中有一個難以自圓其說的規定。“無知之幕”規定人們甚至不知道“關於好東西的理解”(conception of the good)以及自己的“生活計劃”(plan
of life),這樣的話,人就不知道他想要的是什麼了,可是人必須知道想要的是什麼才會做出選擇,否則又能夠選什麼呢?這是個悖論,不僅在行動不可能,在思想上也是不可能的,其錯誤相當於說有個“我思”(cogito)卻沒有“所思”(cogitatum),或者相當於及物動詞沒有賓語,僅僅“我要……”是說不通的。胡塞爾早就指出,如果沒有明確的所思,我思就是無意義的。羅爾斯知道這個麻煩,為了自圓其說,他假定,雖然人們不知道他們的特殊偏好,但仍然知道那些“對任何人生計劃”都必需的“基本必需品”(primary goods)。這個辯護暗含著更大的麻煩,它涉及一個從來也沒有得到解決的“價值排序”問題:在哪些東西算是“基本必需品”的問題上,人們並沒有一致意見,而所以沒有統一意見,是因為人心各異。把人看成“有思無心”顯然是在迴避困難,而如果把所有博弈者看作是同心同好的特殊人群(比如說一群葛蘭臺或者一群弗洛伊德),那倒是說得通了,可那樣的話,羅爾斯理論就縮水為特殊有效理論而不是普遍有效理論了(羅爾斯不會滿意的)。
就羅爾斯強調的“基本必需品”來看(個人權利、個人自由、機會和財富),他想象的合格人群大概是個自由主義群體,等於事先強迫所有人都成為自由主義者,這既不公平也不合乎事實。人是多種多樣的,事實上很多人會首選“權力”(尼采會同意),很多人會首選“家庭利益”(孔子會同意),如此等等。也許羅爾斯不得不把“基本必需品”假定為不證自明的,以避免與無知約定產生互相矛盾,但他想象的自由主義偏好顯然並非不證自明,比如權利的好處恐怕就沒有權力的好處那樣明顯,權利、自由和機會甚至加上財富也不見得能夠換來權力,而權力卻能夠換來一切,這才是更加顯而易見的。從邏輯上看,每個人最想要的恐怕是安全與權力(霍布斯會同意)。即使權且侷限於羅爾斯羅列的那些“基本必需品”,人們也必定有不同理解,哪些權利是基本的?哪些權利更應該優先?各種權利之間的衝突如何解決?這些都是未決的問題。在這樣情況下,羅爾斯隱去了對價值的理解(conception of the good)而又承認關於“基本必需品”(primary
goods)的知識,此間自相矛盾恐怕難以避免,因為後者依賴著前者。對尚未確定的知識的非法透支是一種很隱蔽但不可接受的學術赤字。
羅爾斯的初始狀態背叛了霍布斯開啟的初始狀態思路並且迴避了霍布斯問題。事實上,荀子–霍布斯問題才是必須克服的真困難,而且各種可能的困難都包含其中。羅爾斯問題在規模上要小得多,基本上侷限於如何理性地形成社會契約。實際上,即使有了社會契約,合作的難題也並沒有因此被解決,契約並不能限制人們以合法手段互相坑害並且在必要時撕毀契約。社會始終存在著這樣一個悖論性的局面:在大多數情況下,尤其從長遠考慮,合作對於博弈各方(無論強弱)明明都有利可圖,但合作卻總是非常困難,人們總是難以超越個人的眼前利益。正如奧爾森指出的,即使人們非常願意合作,大規模的集體合作仍然可能毀於搭便車之類的自私選擇。羅爾斯的“無知之幕”簡化和削弱了博弈問題的難度,它使得人們在同等的無知黑暗中人人自危,只好“必然地”選擇了羅爾斯預先準備好了的合作方式。這個事先安排好的圈套不能代表人們真正自願的選擇。“無知之幕”下的選擇是對初始博弈這個嚴重問題的一個有些輕浮的解決。
即使侷限於羅爾斯給定的遊戲條件就事論事,“無知之幕”也並非必然地產生羅爾斯式契約,特別是其中最有名的“有別原則”。“有別原則”聲稱,如果社會不得不出現某些不平等的制度安排,那麼這些不平等的制度安排必須有利於最弱勢群體的利益最大化。很多人讚賞這一劫富濟貧傾向的制度安排(包括我在內),但也有許多人堅決反對,例如諾齊克等。情感傾向歸情感傾向,理性歸理性,儘管這個原則是個廣得人心的道德要求,卻不見得是一個必然的博弈結果,就是說,羅爾斯契約並不是羅爾斯條件的唯一必然結果,而只是多種並列的可能結果之一,甚至不是最可能的結果。換句話說,羅爾斯契約並非羅爾斯問題的唯一解,而只是多個可能解之一。如果羅爾斯契約只是或然結果的話,羅爾斯方案的意義又將有進一步的損失,即羅爾斯契約不但並非普遍有效,而且並非人們的必然選擇。我們不能因為同情羅爾斯的道德選擇而斷定其有效性,理論不能感情用事。
羅爾斯以“無知之幕”得出其公正原則的過程中存在著博弈論上的技術疑點。他應用博弈論的“極大極小定理”(maximin principle)去分析“無知之幕”條件下的理性解。給定人人自私而無視他人利益,人們將理性地避免對自己最不利的情況而選擇風險最小的結果。無知之幕讓人們人人自危,不知道揭開無知之幕之後自己的資本、能力和地位,因此人們寧願選擇一種最保險的社會契約,以免自己處於不利地位時明顯吃虧。博弈論和經濟學都假定,人人都不願意自己吃虧而讓別人佔便宜。這個假定雖然不是普遍必然的,但似乎對大多數人在大多數時候有效。羅爾斯相信,正是出於風險規避的考慮,人們將必然選擇一個保證每個人同等自由權利、機會均等而又保證照顧弱者的制度安排。可問題是,羅爾斯方案未必是唯一的理性解,而只是多個可能解中的一個,而且未必是最可能的解。分析如下:
(1)羅爾斯以自由主義偏好去猜想人人必然優先考慮個人自由,這已經比較可疑。事實上人類是在經過無數殘酷經歷之後才認識到個人自由的好處,不可能先驗地擁有“個人自由比別的事情更重要”這一經過長期實踐才產生的後驗知識,何況這個後驗知識也不是普遍必然的知識。在某些社會語境和自然條件下,個人自由就未必優於集體利益,比如在資源非常匱乏或嚴重危機或自然災害之類情況下,集體共產就很可能是大家得以勉強存活的條件。哲學家經常忘記,價值不是個常數,而只是個函數值——價值,顧名思義,本來就是一個函數“值”。按照“無知之幕”的規定,人們並不知道社會、時代和資源的情況,因此,在“自由”、“平等”、“平均”、“共產”等等可選項目之間,既然缺乏函數語境,也就沒有必然根據和理由去算計和證明哪一種能夠避免最壞結果。當缺乏清楚的語境和計算條件,一切都是未知數。假如非做出選擇不可,在“無知之幕”的壓力下,人們恐怕更容易接受保險係數最大的集體主義契約,因為“有難同當,有福共享”的集體主義契約比自由主義更符合理性的風險規避原則。羅爾斯似乎算錯了自己出的題。“有別原則”雖有平等主義傾向,但並不徹底和充分,羅爾斯的自由主義原則的優先性對平等主義形成了制約,使之不可能是真正的平等主義,只是比較保險而決非最保險的策略。相比之下,令人討厭的利益均分平均主義就比羅爾斯的選擇更符合理性要求了。
平均主義策略可以這樣分析:由於無知之幕,每人落在任何一種地位上的概率是同樣的,相當於抓鬮,根據博弈理性,利益均分是每個人風險最低的策略,它保證每個人獲得至少不少於任何人的收益。在自己沒有權利去挑選較大利益的情況下,利益均分就是優選策略,由此看來,平均利益才是邏輯上無懈可擊的均衡解。可以參考“公平分蛋糕”的經典例子(儘管情況並不完全一樣):a切蛋糕而b先挑。a沒有權利先挑選(相當於不知道自己將要得到什麼),他的最好策略就是把蛋糕儘量切成一樣大[4]。同理,在無知之幕條件下,平均利益才真正是極大極小值,同時它又是極小極大值,是真正的鞍點。在這種情況下,平均利益顯然好過羅爾斯“扶貧”式的有限平等。石元康先生有過更有趣的論證[5],他說,平均主義有個額外的優勢:人們“不會忌妒”,因此是個更穩定的策略。當然,在真實社會里,平均主義通常並不公正,甚至是反公正的,除非遇到特殊情況,否則人們不會喜歡平均主義,可是羅爾斯的無知之幕很不幸地正相當於那種有利於平均主義的特殊情況。也許還應該注意到,羅爾斯的有別原則也同樣不公正,正如諾齊克所批評的,沒有正當理由的利益再分配其實是掠奪。
更有趣的是,即使強行規定只能選用羅爾斯原則,不許選別的,還是拯救不了羅爾斯方案,因為相對平等終將慢慢地演變成平均主義。其演變過程是:根據“有別原則”,如果社會需要某些相對不平等的制度安排,這些不平等的制度安排應該使在社會和經濟方面處於最不利的人們的利益得到改善[6],那麼,假設“處境最不利的人們的收益”為X,而X有理由獲得改善而變成X+n,可是X+n的改善仍然不夠大,還是屬於“最不利人們的收益”,就又有理由進一步改善為(X+n)+1,以同樣理由就可以不斷改善,只要還存在相對的“最不利群體”,就顯然有理由不斷“損有餘而補不足”,這一過程不會自動停車(除非引入保護富人的條款,這又等於增加了額外條件),直到所有人的收益都成為平均數。由平等主義到平均主義的演變顯然是羅爾斯不能接受的,因為它會破壞“更優先的”自由原則。可是,除非有額外的理由對這個演變過程進行剎車,否則“有別原則”必定無法止步地演變成平均原則。進一步說,即使可以增加額外理由,也是非常危險的,如果有某個理由可以使“損有餘而補不足”在某一點上停車,那麼就能夠製造任何理由在任何點上停車,那樣就將是羅爾斯的失敗和諾齊克的凱旋了。羅爾斯試圖在自由和平等之間製造調和,這一努力令人讚歎,但可惜自由和平等之間存在著理論上難以克服的矛盾。不過,在真實社會中,自由和平等可以形成某種動態平衡,但與公正原則無關,而是獲利人群需要為社會秩序、安全和穩定而“購買”不利人群犯上作亂的動機。
(2)如果在平均主義之外還存在著另一個非常可能中選的方案,那麼很可能會是一個古典公正策略,也未必輸給羅爾斯方案。人們願意自己的勞動能夠得到成比例的收益,這個“多勞多得,少勞少得”的對稱意識才是理性先驗直觀。人們天然樂意承認這種古典的對稱性公正(在理論上說,這是唯一嚴格的公正)。在無知之幕下,假如人們不選擇平均主義而選擇了古典公正,也同樣合乎情理。平分利益雖然最能滿足風險規避原則,但支出與收益的對稱也同樣沒有違反風險規避原則,即使某人在無知之幕消失後發現自己能力較小,只能獲得較小收益,這樣也沒吃虧,因為畢竟得到了該得份額,並沒有得到小於成本的回報。人們沒有理由對此不滿意,除非能夠證明懶惰、弱智、無賴、偷竊、不勞而獲也是美德,此種證明恐怕很難。因此,在無知之幕下,不敢指望暴力、偷竊、耍賴等等風險策略的人們非常可能會選擇平分利益的平均制度,但也很可能願意選擇古典公正制度,這兩者都是理性選擇,中選的可能性恐怕優於或至少不弱於羅爾斯契約。當然,這不意味著它們比羅爾斯方案更好。羅爾斯方案是相當優秀的社會制度,大概相當於平均主義和古典公正的中間道路,但問題是,它在實踐方面恐怕是個不可靠也不穩定的策略,而且在理論上不可信。
(3)最後,羅爾斯方案還有一個致命漏洞:他沒有考慮到如何對付當無知之幕消失之後的後繼博弈的破壞性情況。羅爾斯知道無知之幕總要消失,按照想象,在完成立憲和立法任務後就不需要無知之幕了。初始狀態下的博弈只是第一輪博弈,而博弈總是連續多回合的。權且假定羅爾斯方案在初始狀態裡中選(儘管並非如此),當無知之幕消失,博弈條件完全改變了,博弈各方的優選策略也必定隨著地位變化和“有知”狀態而發生根本變化。當一切真相大白,相當於進入了真實生活,人們各就各位,有了明確的各自利益,肯定有許多人(具有博弈優勢能力的人)將重新考慮並調整自己的策略,因為他們在第一輪博弈中選擇的羅爾斯方案已不再是優選策略,而變成了專門讓自己吃虧的策略。人們的新策略必定導致在第一輪博弈中所建立的“制度”土崩瓦解,或者在具體實踐中被偷偷解構。人們很可能不承認在初始狀態下所簽定的糊塗契約,而將在新的形勢下重新討價還價、重新協商、重新鬥爭甚至革命,即使人們沒有實力改變法律或發動革命,也總會在契約下去鑽各種空子和漏洞,使契約實際上無法執行或無法正確兌現,總之是從“合作”回到“背叛”狀態,直到某種符合現實形勢的新制度在多輪博弈之後達到某種穩定策略均衡而得以建立。既然無知之幕下所簽定的社會契約在後繼博弈中是堅持不住的,遊戲終將重新玩過,羅爾斯契約終成畫餅,這就是羅爾斯方案的根本困難。關鍵在於,無知之幕是靠不住的,所謂“騙得了一時騙不了一世”,人們總會在後續博弈中顛覆原先的盲目之約。
三、回到荀子—霍布斯思路
羅爾斯方案雖然引人入勝,可惜不是有效出路,轉了一圈還是回到了老問題上,我們還是不得不回來面對如何在衝突中形成合作的這一初始問題。“無知之幕”是個多餘的假設(當然可以是個智力遊戲),它改變了真問題的存在條件,因此對於解決真正的問題並沒有很大的幫助。雖然我們需要理論模型,但歸根到底要解決的是真實問題。理論不能忘記生活,從生活中來還要能夠回到生活中去,理論模型不能背叛真實生活,因此必須能夠容納複雜變量以便能夠對付真實問題。許多理論方案,例如羅爾斯方案,卻選擇了變量最小化的極簡主義模型,生活變量的極簡化等於篡改了生活,文不對題所以不能解決真實問題。相比之下,荀子–霍布斯的初始狀態假設仍然在理論上較優,它能夠包括一切可能社會狀態中的最壞狀態,這是優勢所在。顯然,在各種可能狀態中,只需考慮最壞的,最壞狀態已經代表了所有困難。沒有把最壞可能性考慮在內的社會分析模型都是無效的。羅爾斯設想的條件實在不夠壞,應該說太好了,所以無效。這就是為什麼需要回到荀子–霍布斯思路的關鍵理由。
荀子和霍布斯對於從衝突到合作的解決原則很相似:(1)強人們意識到衝突對任何人都不利,包括對強人自己也不利;(2)只有強大政府能夠通過權威而造成社會合作。不過問題是,集權雖然能夠導致社會合作(歷史事實證明這一點),可也非常可能導致與衝突同樣有害甚至更加有害的結果(比如個人自由的嚴重損失),因此人們需要尋找比集權更優的合作條件。艾克斯羅德指出:人們對“在什麼條件下才能從沒有集權的利己主義者中產生合作”這個問題更感興趣[7]。在沒有集權的條件下如何產生合作,不僅是更有趣的問題,也是學理上更重要的問題,不僅是一個國家內部社會的根本問題,也是國際社會的根本問題。
羅爾斯的實驗雖老謀深算卻無助於解決問題,而艾克斯羅德的實驗很天真卻令人鼓舞——有趣的是,在艾克斯羅德的實驗中,也正好是天真勝過了老謀深算。艾克斯羅德1980年做過一個試圖理解合作出現的必要條件的計算機實驗[8]。艾克斯羅德的初始狀態不需要諸如“無知之幕”之類的不正常條件,當然,它也不夠真實,比如,博弈各方被假定為能力相等,而且不可能消滅對手而只能在得分上勝過對手,這些限制條件暗中埋下了嚴重的困難,這是後話。無論如何,艾克斯羅德實驗相對於羅爾斯是比較仿真的,它的條件比較寬鬆,不要求博弈者必定是理性的,甚至不一定是“利益最大化者”,更不需要無知之幕。這些寬鬆條件使艾克斯羅德實驗具有某種現實感。
艾克斯羅德設想了這樣的博弈環境:(1)博弈者是多樣的,理性或不理性,謹慎或投機,善良或邪惡,一切動機和心態都可能;(2)博弈回合相當多,回合總數多達12萬回合,類似“一生”;(3)參賽的博弈策略類型也相當多,類似一個社會;(4)博弈可以不擇手段,可以不斷變招,比較接近真實的“人性人”遊戲,而不是經濟學家們喜歡的“理性人”遊戲。
實驗是全體混戰的循環賽,參賽的14個代表性策略由“足夠精明的”各種專家分別設計(一個沒有傻子的社會),博弈策略由“合作”和“背叛”的各種可能組合。如果雙方合作則各得3分,雙方背叛各得1分,一方背叛而另一方合作則背叛5分而合作0分。背叛的回報相當大,與真實生活的情況類似(人無橫財不富)。比賽結果出人意料,一個具有善良、寬容和公正等優良品質的“一報還一報”策略(TFT)優勢勝出。TFT的策略設計非常簡單:第一步選擇合作;從第二步開始就模仿對方上一步的選擇。這意味著:首先是善良,從不先背叛;其次是公正,如果對方背叛就進行回擊;然後是寬容,一旦對方改正錯誤,就馬上重新合作。那些不成功的策略都太想佔便宜,總是主動背叛謀求高分。在比較成功的策略群與比較不成功的策略群之間存在著明顯的得分差異,比較成功的前8名策略都是比較善良的,而所有不成功的策略都是故意與人為敵的。艾克斯羅德對這個太過美麗的結果不放心,第二次實驗使參賽策略增加到62個。他有意把第一實驗的結果事先公開,讓第二實驗的策略設計者們都知道TFT的優勢,相當於事先宣告“好人有好報”,可令人吃驚的是,大多數人還是寧可千方百計地發明更復雜的敵意策略,可見大多數人多麼希望多佔便宜而不惜傷害他人。第二實驗的結果仍然是TFT等善意策略勝出。這個實驗被認為或多或少證明了“好心有好報”或“好人笑到最後”。
這樣的好結果雖是人們一直的夢想,但經驗事實往往並非如此。如果理論與實際不符,肯定是理論出了問題,必須調查原因。艾克斯羅德實驗所以似乎能夠證明“好人笑在最後”,根本原因是其“殺不死”的假定:每個博弈者可能失敗(得分低),但不可能被消滅(殺死),永遠不會被淘汰出局,因此總有翻本機會。這個設定顯然與真實世界不符,不能正確表達人生命運。這是現代學術司空見慣的失誤:人們為了讓實驗能夠出成果,總把實驗設計成一個容易計算但不真實的可能世界,因此導致誤差。理論世界對於真實世界至少應該是一個可通達的可能世界,否則原理不能通用。艾克斯羅德實驗與羅爾斯實驗都存在這個困難,都改變了某些必要的存在論條件而使實驗世界與真實世界不相通。採取了“殺不死”假定,生死遊戲弱化成輸贏遊戲,博弈不再嚴重,命運不再嚴肅。殺不死等於可以後悔,永遠還有機會捲土重來,這就限制了不擇手段競爭的威力,背叛就只能佔到小便宜,不能大獲全勝於一役,從而造成善良策略具有博弈優勢的假象。
假如修改“殺不死”假定,重新規定為,當博弈者由於選擇合作而遭受n次背叛(n次0分)就算被“殺死”或被淘汰出局,情況就很可能非常不同,也許會更接近真實世界。可以推想:在這個生死博弈中還是會有一些善良合作者最後獲得勝利,但也會有一些善良合作者被不幸淘汰,比如TFT,由於具有比較強硬的回擊策略,因此可能在博弈中倖存,但未必能夠仍然成為冠軍。這是個危險的消息,當許多合作者發現可能被淘汰的危險,就可能會選擇“不出頭”、“搭便車”以自保,甚至蛻變成背叛者去傷害他人。“壞人”多佔便宜的信息會使“好人”失去信心而退化,這是個真實的社會難題。在艾克斯羅德實驗中,另一個反真實的設計是,博弈者之間不能交流經驗,即使可以交流,博弈策略也不能中途改變(計算機博弈程序是事先設計好的),好人即使總是吃虧也只能堅持做好人,因此迴避了好人變質的可能性,可問題是,真實生活無法迴避這個困難。可以看出,艾克斯羅德的實驗結果也不能充分有效地應用到真實世界中。
艾克斯羅德的實驗成果儘管有些疑問,但他把這個實驗的基本精神和原理推廣應用於研究社會進化時,卻還是獲得了一些重要而值得分析的發現:
(1)那些專門佔別人便宜的博弈者在遇到同樣的小人時,就會兩敗俱傷,大概證明了“惡人自有惡人磨”。而且,如果一個社會壞人太多,壞人就反而佔不到便宜,因為壞人遇到壞人而兩敗俱傷的幾率增大。從進化角度看,開始時壞人會迅速繁殖,但壞人增多又使得壞人更多地遇到壞人,這樣又導致無利可圖,長此以往就迫不得已只好選擇合作,這不需要壞人真的洗心革面,但剋制自己做好人就幾乎相當於好人。合作策略更能發展成穩定策略(由穩定回報來保證),因此好人會越來越多。但合作策略的穩定性並非堅如磐石。好人增多又會導致壞人有較多機會獲利,於是壞人又會增殖。社會狀況的循環波動是經常性的,事實上的社會總是保持好壞因素混合存在而此起彼伏的狀況;
(2)如果新來者是單個人的話,一個背叛成風的小人群體就能夠阻止其侵入落戶,但如果新來者是一個合作性的群體,哪怕是小群體,卻一定能夠成功侵入並且發展壯大。與此相反,哪怕是規模比較大的小人群體卻很難成功侵入合作群體,因為合作群體能夠形成集體團結力量而勝過只顧自己各懷私心的小人。這似乎證明了團結就是力量。但值得注意的是,這條規律不能過分演繹,因為,假如按照這個規律來簡單推論的話,那麼小人遲早是要失敗的,而社會歷史已經很長了,現在應該幾乎沒有小人了才對(小人們只好改過自新變成合作者),這顯然太不可信,與事實不符,也與前面的發現互相矛盾。據說有數學家證明說,假如存在吸血鬼,哪怕開始只有一個,到今天也不可能有人存在了,因為吸血鬼不斷壯大,而人遲早被吃完,所以,事實反證了不可能有吸血鬼。與此類似,假如好人總能勝利,到今天就不可能有小人存在了。因此,只有結合前面的發現來理解社會,才能理解為什麼好人和小人都沒有能夠獲得全面勝利;
(3)艾克斯羅德還試圖證明,合作的基礎與其說是信任和友誼,還不如說是關係的可持續性,只有當人們有著值得重視的未來,才能保證持續穩定的合作關係,就是說,長遠的未來使得持續的合作關係具有價值,如果不存在未來,合作就失去意義。這個殘酷的發現打擊了我們對道德的信心。不過,對此並非不能質疑。也許信任和友誼並非合作的必要條件,但仍然可以是充分條件,這一點多少能夠維護我們對道德的期望。另外,可持續的未來是否就是合作的必要條件或充分條件?這也並無十分把握,事實上確實有人一意孤行寧可自取滅亡也故意不與人合作。另一方面,“沒有未來”也不一定導致背叛,有時反而會是合作,比如“人之將死其言也善”的現象,這是因為,雖然“沒有未來”註定了不再有利益回報,可同時也意味著無可損失了,因此,“沒有未來”是否導致背叛還要取決於具體情景和人品。未來的權重和持續關係未必就比信任和友誼更能夠促成合作,我們不應該輕視美德。不過,信任、友誼和高尚人品確實並不普遍存在,而與利益密切相關的未來權重和關係持續性卻無處不在,在這個意義上,艾克斯羅德是對的。然而更有趣的問題是,未來和關係的持續性並非可以完全放心的合作條件。
在艾克斯羅德實驗中,博弈者之間沒有語言交流,只能根據對方的策略來做出回應。這是個有爭議餘地的設計。語言能夠把本來需要在時間中一步一步做出來的事情化作語言空間裡的“可能事實”來討論和交流,這個化時間為空間的功能使得人類能夠事先演習各種策略,從而避免大量實踐失誤。顯然,有聲的博弈與無聲的博弈有著根本差異,而無聲的艾克斯羅德實驗不能充分說明真實博弈。儘管艾克斯羅德相信,成功的合作並不非要語言交流不可(他鐘愛的例子是第一次世界大戰時英法部隊與德國部隊之間沒有通過語言而達成“都給對方留活路”的合作策略)。但無論如何,默契合作肯定不是主要的合作方式,人們通常無法在無語狀態下充分知道對方的要求和策略,必須通過語言交流才能公開問題、擺明情況甚至亮出底牌。如果雙方都知己知彼,博弈情況將完全不同。關於他人的知識在博弈中無比重要,如果省略這個因素就會錯誤理解形勢,包括對未來的估計。僅僅考慮到“未來”的重要性並不能保證選擇正確的合作策略,而關於未來的正確知識才是真正起作用的因素。語言的重要性就在於此,只有語言才能預告未來,提前說出來而把未來變成預先可見的,這有可能改變博弈情況。因此,最合理也最如實的理論必須考慮有聲的博弈,這正是哈貝馬斯不遺餘力強調的。
“正確的”語言活動是否能夠化敵為友?是否能夠促成由背叛到合作的進化?這是個更為複雜的問題,因此需要討論一個與羅爾斯和艾克斯羅德都不同的哈貝馬斯設想。儘管羅爾斯和艾克斯羅德非常不同,但有一點是相同的,他們設想的都是實驗室裡的遊戲,都是由不真實的博弈條件和不真實的人所構成的,都省略了一些事實上不能省略的條件,其中最不應該被省略的條件就是語言活動。
羅爾斯遊戲沒有明文規定不許進行語言活動,但無知之幕導致信息極度匱乏,對話幾乎沒有意義,因為沒有什麼可說的;艾克斯羅德遊戲裡的策略是預先設計好的程序,即使可以交流也不能更改。忽略語言活動正是使實驗遊戲與真實世界難以相通的一個重要原因。因此,忽略語言活動肯定不是好的遊戲設計。羅爾斯的一個缺陷就是,他想象的人都是在“獨白”,這是現代主體理論的通病。現代主體(笛卡爾—康德—羅爾斯式的主體)只意識到獨白式的理性,這是哈貝馬斯很不滿意的。獨白不是有效的語言活動,獨白的反思並不能代表別人的意見,更不可能代表所有可能的觀點,因此康德或羅爾斯的各種原則都必須能夠通得過“對話檢驗”才能被證明是普遍的,否則只是獨白主體的一廂情願。哈貝馬斯的貢獻是,他把康德的實踐理性進一步發展為“交往理性”,把“獨白式”理性變成了“對話式”理性,把主體性的理性變成了主體間的理性,由此“他人”才真正具有了對等的意義。在“獨白式”理性那裡,無論多少人都被假定在思維上等於一個人,據說理性是普遍的,卻沒有考慮到理性所要處理的問題並不是預定普遍的。哈貝馬斯發現了這個嚴重問題,他希望人們能夠在交往理性中把原來互相沖突的不同意見化為一致意見。交往理性似乎成為了能夠化特殊為普遍的途徑,於是,衝突的遊戲就變性為對話遊戲。如果經過對話能夠達成一致同意,那麼,哈貝馬斯式的互知下的一致同意顯然優於羅爾斯式的互相無知的一致同意,因為充分信息條件下的一致同意比起限制信息的一致同意不僅更真實而且更難得。
說話的內容能夠表達利益和價值衝突,因此,話語世界必定是個政治世界。甚至,語言本身就是一種政治,當使用這樣而不是那樣的語言去命名、定義和描述世界,就同時是在重新安排甚至虛構事物(福柯指出語言安排了事物的秩序),比如說,當談論某種神怪就是虛構了這種神怪。把某種事物定義和描述成這樣而不是那樣,製造出這樣而不是那樣的事物,賦予事物這樣而不是那樣的價值,這是支配心靈的最有力的政治,語言所規定的思想空間、思想方式以及思想對象變成最大的政治問題,甚至可以說,沒有語言活動就沒有政治。古希臘的城邦政治就是廣場話語的政治。在這樣的語境和意義上,哈貝馬斯設想的以語言活動為核心的政治遊戲就是更值得分析的模型。哈貝馬斯遊戲不必是初始遊戲,而可以是任何階段都可能出現的一個遊戲狀態。初始遊戲是什麼樣的狀態並不重要(反正都要過去),只要能夠進入“理性交往”的對話遊戲,就有望消除衝突。由於拒絕了各種生硬的人為條件(如“無知之幕”等),哈貝馬斯遊戲具有了很高仿真性,但同時又指向一個難以成真的理想化烏托邦。
哈貝馬斯推薦了一個據說能夠形成合作的理想化遊戲模型,即“理想說話環境”(ISS)。這個想象源於古希臘城邦政治的公共領域傳統,相當於想象了一個“最好的公共領域”。公共領域雖好,卻並非必然成為人們的集體選擇,因為沒有理由能夠證明公共領域遊戲必然對每個人都更有利,也不能證明這個遊戲將是每個人自由選擇的共同結果(獨裁者、宗教狂、偏執狂、強人、官僚主義者、暴力傾向的人、懶得跟人廢話的人,見人就煩的人,等等,就不見得喜歡這一遊戲)。如果不是自由選擇,就不可能證明什麼樣的規則、契約和制度將是人們真正的集體選擇。那麼,人們為什麼要放棄衝突而改為對話,就還是個未決問題。可見一個缺乏初始性的遊戲終究是不徹底的,它需要更多的解釋。
權且假設人們碰巧都願意進入對話遊戲。ISS要求所有人平等地、理性地、公開地進行對話,最後達成同意形成一致意見。對話規則為:(1)任何人都有資格參加對話;(2)任何人都有資格提出自己的任何觀點和質疑任何觀點;(3)任何討論都必須是理性的;(4)妨害(1)、(2)、(3)的行為都被禁止[9]。另外,判定對話溝通的有效性標準是:(1)所說的話必須是“能懂的”(comprehensible);(2)所說的話必須是“真的”(true);(3)所說的話必須是“真心的”(truthful);而且(4)所說的話以及說話方式必須是“正當的”(right),即論辯必須合乎理性標準,觀點必須有正當理由[10]。
這些要求貌似平平無奇,其實是很難被滿足的高標準嚴要求。哈貝馬斯這些平實要求決不平庸,但有些幼稚。事實情況是,越是最起碼的道德規則就越不可能落實為普遍必然的實踐,比如說謊,就無法避免,有些謊言甚至有助於拯救和正義;虛情假意也不可避免,許多時候需要給人面子;說話永遠正當和正確恐怕歪曲人性,沒有激情、偏心、任性和憤怒,只有乾巴理性,一切正確了,生活卻不值得一過了。當然,哈貝馬斯可能會說,ISS只適合專門的對話時刻,平時就不用那樣。這多少是個辯護,但還是說不太通,因為大多數共識、契約和制度都是在平常生活中經過長期博弈磨合而形成的,是在長年累月的日常談話中逐步形成的,而不是在會議桌上談判而成的。平常生活的長期實踐是絕對必需的,因為生活的豐富性、複雜性和不確定性超出我們的想象力和理性能力,各種事情只能慢慢發生,不可能一切都做到未雨綢繆、百無一漏而胸有成竹,那是典型的德國唯心主義想象。維特根斯坦關於“遵循規則”的研究就分析了具體實踐是如何把好像明確的規則搞得面目皆非的。“說”了不算“做”了算,這是生活的最終道理。制度和規則是長期博弈所形成的穩定均衡,是“做”出來的,而不是“說”出來的。儘管在廣義上“說”也可以看成一種“做”(日常語言學派就研究“說話即行事”的問題),但兩者畢竟本質不同,說的未必能夠兌現為做。
即使只限於說話,有效的“說”也必須足夠豐富乃至於能夠反映“做”的豐富性,這樣才能在“說”中象徵性地處理“做”的問題。但ISS是個“說”跟不上“做”的典型案例。ISS並不是充分自由的說話而是談判式說話,是個因約束而失去豐富性的侷限性公共領域。當生活對話在ISS中被限制為貧乏的正確對話,通過對話達成協議的能力雖然似乎提高了(是否真的提高了還有待實踐考察),但所能夠達成的協議卻恐怕文不對題,未必能夠回應真實生活中需要解決的那些問題。問題在於,刪掉了“不正確”和“不真實”的話語就等於刪節了生活,這樣削足適履的結果就是無法回應足夠多的生活問題,而重要問題很可能就漏掉了。語言中的問題至少必須與生活問題等價,語言可以大於生活,但不能小於生活。因此有理由擔心,ISS雖然提高了對話達成協議的能力,卻只能達成一些不太重要的協議,生活的重大難題還是沒有被解決,甚至沒有被觸及。
另外,哈貝馬斯還忽視了ISS的一些技術性困難。比如說:(1)“真”的概念是一直爭論未決的問題,如果說要追求真理,當然沒有問題,但把“真”作為標準或規則,就難免有些模糊。邏輯真與經驗真就非常不同,許多詭辯在邏輯上為真但在經驗上為假。即使把真理限定為經驗真理,其標準也有爭論。最成問題的是,人類需要說的有意義的話大部分都不符合真理要求,包括關於未來的談論、關於歷史的討論、關於政治的分析、涉及道德和審美價值的評論,以及關於趣味、偏好和主觀態度的議論,甚至關於當下事實的描述,都不是真的或很難是真的。因此,“說真話”這條標準有效範圍非常小,作用有限;(2)ISS的話語有效標準之間也存在矛盾,比如“真心話”與“正當話”就有可能形成矛盾,有些真心話說出來會很嚇人很噁心,在政治或倫理上很不正確,至少不禮貌,而大量正當話卻又是虛偽的或者是敷衍了事的廢話。因此,“真心”與“正當”往往不能同時滿足,這正是為什麼生活中需要禮貌、花言巧語和虛情假意的原因。另外,“真心”與“真”、“真”與“正當”也都會出現類似的矛盾。
無論如何,哈貝馬斯的對話遊戲把康德的實踐理性發展為交往理性,把獨白變成對話,這是理性主義的一個重要進展。但哈貝馬斯也仍然繼承了理性主義的一個頑固錯誤。理性主義所理解的“人”只是理性人,理性被認為能夠解決一切問題,這種理性的妄想完全忽視了心(heart)才是一切根本困難之所在。理性能力足以解決“思”(mind)的問題,卻無力解決“心”的問題,心的問題落在理性能力之外。哈貝馬斯雖然克服了理性的獨白困難,卻仍然重複了崇思貶心的理性主義困難。這是一個非常值得分析的問題,它觸及了對話問題的根本。
按照哈貝馬斯理論,對話的成功路徑是這樣:理性溝通(滿足ISS標準)→ 互相理解→ 一致同意。這個過程很理性化,但不夠人性化,對於人工智能之間的合作大概是足夠了,但對於人之間的合作就恐怕不夠。問題出在“互相理解”與“一致同意”之間漏掉了一個關鍵環節:互相接受。互相理解至多是同意的必要條件而決非充分條件,因此“互相理解”無法確保“一致同意”[11]。在許多情況下,對話雙方完全互相理解了對方的需要和看法,都非常同情對方的處境,但決不接受對方的主張,因為對方的主張與自己的主張水火不容。因此,互相接受是一個絕不能省略的條件和環節,而且比互相理解重要得多。互相理解不是一致同意的充分條件,但互相接受卻是一致同意的充分條件以及必要條件——即使在並不完全互相理解的情況下,也可能形成互相接受。因此,完美的成功對話過程應該修改為:理性溝通 → 互相理解 → 互相接受→ 一致同意。這個升級版的對話模式與哈貝馬斯模式雖然差別不多,但卻有著根本的區別,因為“互相接受”這個條件捲入了“心”的問題,而心的問題卻落在理性的能力之外了,要解決心的問題就必須引入理性之外的精神原則,這樣,問題就複雜了。
不過哈貝馬斯仍然希望能夠捍衛理性的絕對地位,他曾經在回答我的這個挑戰時辯解說(大概意思):理性仍然是足夠有能力的,只不過理性也不能一蹴而就,如果正確對話的時間足夠長,各種衝突應該可以在互相理解中慢慢消磨掉,理性加上時間就總能夠消除各種無理要求導致的衝突。這倒是個有趣的問題。時間確實可以消解許多衝突,可是時間並無偏心,正如時間可以消除衝突,也同樣可以積累衝突,可以消除舊矛盾也可以產生新矛盾。哈貝馬斯似乎沒有注意到時間是兩面派。為什麼哈貝馬斯非要捍衛理性的絕對地位?可以這樣猜想,理性主義所以不願意考慮“接受問題”,大概因為,如果承認了“接受問題”,就不得不進一步承認心的問題與思的問題的並列重要地位,也就等於承認了理性之思不可能解決一切問題,這對於理性主義是個釜底抽薪的挑戰。無論是否情願,心的問題終究迴避不了,心是所有衝突的根源,根據“解鈴還需繫鈴人”原理,心的和解是化敵為友的唯一解法,只有通過接受他者之心才能真正接受他者。如果無視心的問題和“互相接受問題”,無論多麼充分徹底的理性對話都將是徒勞。
“互相接受”的最大難點很可能在於價值排序。大多數人在其價值觀體系所包含的項目上大概有著相似甚至相同的理解(所謂人同此心),但在各個價值項目的排序上卻各有偏好(所謂其心必異)。假定所有人都選擇了A, B, C, D, E作為基本價值,比如自由、平等、公正、美德和財富,又假定其中有些人承認價值排序{B, C, A, E, D},這是以平等為首的價值觀,而另一些人則承認價值排序{ E, C, A, D, B},這是以財富為首的價值觀,儘管這兩種價值觀所承認的價值項目別無二致,但不同價值排序使其價值觀南轅北轍,甚至不共戴天,就像碳元素由於分子結構排列不同而形成鑽石與石墨。當然,還可以有其他多種排序,而且許多種排序之間也都互相難以兼容。價值排序問題說明了,所謂“在許多事情上有著共識”其實距離“達成一致同意”還有萬里之遙。價值排序問題可以解釋許多事情,比如文化差異、文明衝突、制度對立、社會選擇的困難以及國際合作之艱難等等。可以看出,即使哈貝馬斯所預設的那些理性共識確實普遍存在,理性對話恐怕也未必能夠——估計基本沒戲——避免和解決心的衝突,即精神原則、價值觀排序以及情感方式的衝突。心的和解恐怕不能靠說,而要靠做。
總之,對話雖是避免暴力衝突的理性之路,但不能避免非暴力衝突。事實上,對話是個艱難無比的博弈,其難度並不亞於行動的博弈。對話遊戲的優勢在於能夠以紙上談兵的方式把各種問題和底牌提前亮出來,它是一個信息更加充分的遊戲,雖然各種問題變得清楚起來,但所有困難的實質並沒有改變,因此,我們還需要進一步尋找真正能夠解決問題的秘密。
六、和諧的條件與孔子改進
以上討論了關於衝突到合作的幾種聲望卓著的研究,大同小異的研究還有許多,但同樣都還沒有發現這個難題的真正有效解法。根據前面的分析可知,要形成從衝突到合作的進化至少需要這樣一些博弈條件:(1)每個人的自由選擇權利;(2)長時間的未來;(3)可以暢所欲言的理性對話。但僅僅這些條件是不夠的,甚至這些都還不是最關鍵的條件。那麼,到底漏掉了什麼特別重要的條件?
許多人寄希望於信任[12]。信任的吸引力是明顯的,首先,信任確實是合作的充分條件,有了互相信任必有合作;其次,信任是眾望所歸的傳統美德,儘管眾望所歸的信任在真實遊戲中並不容易實現為齊心協力,但信任畢竟並沒有被殘酷的社會事實完全摧毀,仍然存在於某些關係和情景中。不過,信任畢竟只是心理現象,並非不可動搖的鐵的事實,信任本身是難以絕對信任的,這個困難降低了信任理論的意義。進一步說,“信任如何可能”與“合作如何可能”這兩個問題其實幾乎是等價的(儘管不完全等同),很難把信任看作是合作之前就預先存在的條件,在許多時候,合作是信任的條件而不是相反。有信任就可以有合作,反過來,有合作就可以有信任。在信任和合作之間存在著循環解釋,因此,以信任去解釋合作或多或少是廢話。真正的難題是,在沒有信任的情況下怎樣才能形成信任,或者,如何從不合作進化為合作。顯然,如果預先設定了信任,就不太可能出現“囚徒困境”之類的問題了。另外,眾所周知,公正的制度能夠形成並且維持合作,其中特別重要的是法治和自由權利制度。假如已經存在公正的制度,確實能夠促進合作,公正的制度是合作的充分條件,但公正制度也不是在合作之前的給定條件,反而是社會合作的一個重要成果。這裡不能顛倒因果。需要研究的正是,在尚未存在公正的制度的條件下,合作如何成為可能?同樣,哈貝馬斯想象的具有良好正當程序的公共領域也是一個制度,是個話語制度,但也是社會合作之後的產物,不能提前預支。
如果不能提前預支各種以合作為前提的制度,包括信任關係和各種良好制度,那麼,前面預設的三個條件又必須進一步修改為:(1)每個人都擁有自由選擇的能力;(2)長時間的未來;(3)語言交流。這是一組弱化了的條件,在(1)中,“自由”不是憲法確認和保護的權利所定義的政治自由(liberty),而是未被權利所定義的僅僅作為自主能力的天然自由(freedom),因為權利體系是合作產生的制度,不能預支;另外,在(3)中,作為制度存在的具有良好程序的公共領域也被弱化為自然狀態的語言活動,因為公共領域制度也不能提前預支。自然狀態的語言活動當然不是理想的對話狀態,人們可以說謊,會說不正當的話或無理的話,可以說苦口良藥的話,也可以說出殘酷真理,甚至恐嚇威脅,總之是全部真實的語言活動。這樣的博弈環境幾乎回到了荀子–霍布斯的初始狀態。如果願意對荀子–霍布斯的初始狀態有所改進的話,可以優先語言活動。在語言遊戲中進行博弈可以象徵性地代替許多實際衝突,紙上談兵有可能避免無謂的損失。既然語言活動是代價最小的博弈方式,就理當成為博弈的首選方式。
給定修改版的荀子–霍布斯初始狀態,從衝突到合作的進化是否可能並且如何可能?人人知道,衝突使人們只能獲得最差收益,因此,從單純利益上考慮,人們應該有合作動機。唯一缺少的是克服“零和博弈”、“搭便車”、“囚徒困境”之類不合作的必然有效策略,或者說,能夠保證由衝突向合作進化的充分條件。艾克斯羅德似乎證明了合作進化的關鍵條件是“好人幫好人”,它的雙贏效果使好人集團擁有勝過壞人的集體力量,這是個令人鼓舞的好消息。可是正如前面分析的,艾克斯羅德遊戲的規則實際上對好人有所偏心,永遠不會被淘汰出局於是永遠有翻本機會的規定顯然更有利於好人發揮互助的長期博弈優勢。另外,更可疑的是關於“好人”的假設,艾克斯羅德的好人假設是本質論的,預設了具有合作本性的好人群體的存在,這個過於樂觀的假設迴避了最嚴重的可能挑戰。在理論上說,更為合理的假設有兩種:(1)每個博弈者都是壞人。雖然這個假設不符合事實(其實總會有好人),但它充分表達了可能的最差狀態,因此足以覆蓋一切可能狀態,因此在理論性上最優。這是霍布斯式的假設;(2)博弈者的所謂好人品格和壞人品格是非本質的,是相對的和情景性的,就是說,不存在絕對穩定人格,一個人總是在特定人際關係中相對於特定他人而成為好人或壞人的。這個假設也同樣足以解釋一切可能狀態,也是理論上最優的設定。這是荀子式的假設。只有這兩個假設能夠無遺漏地覆蓋一切可能狀態,因此在理論上優於艾克斯羅德假設。
如前所論,荀子–霍布斯假設至今仍然是最老到的,最充分表達了一切可能狀態。荀子和霍布斯所見略同地假定了人們只能去選擇有能力建立公道秩序的強人作為代理人,來建立秩序和管理社會。這個具有專制傾向的強人統治一般被認為是危險的,尤其不合當代人的價值觀。當代人對民主如此迷信以至於相信民主是權力合法性的唯一根據。假定人們都同意以民主方式產生統治代理人,顯然也不是為民主而民主,而是為了背後的目的。民主本身既不是生存所需也不是利益所在,甚至不是樂趣而只是一種有效手段,因此,重要的不是民主,而是人們希望通過民主這種手段去獲得的利益。制度之爭仍然不是觸底的問題,無論什麼制度都是試圖達到某種利益的手段,因此,更深入的問題是:(1)人們到底是因為什麼而選擇了某種制度?(2)什麼樣的制度才能使人們普遍滿意,因而願意維持合作並且把對制度的反叛降到最低程度?這兩個問題的答案非常可能是同一個,即人們發現策略S對所有人都有好處(普遍受益),並且,人們選擇S的收益好過拒絕S的收益(利益改進),因此,S就非常可能發展為一個用來保證合作的穩定製度。
艾克斯羅德證明,主動追求合作的TFT策略在長期博弈中能夠獲得明顯優勢,人們不至於視而不見,人們會被其成功所誘惑而去模仿這個擁有最好收益的選擇。但我們已經分析了,TFT所以如此成功是因為遊戲的特殊規則對它相對有利,這與真實世界有不小的差距,因此,TFT還不是我們所尋找的答案S。但艾克斯羅德實驗還是給出了一個非常重要的啟示:既然模仿最好收益的策略是擋不住的誘惑,那麼,具有優越性的合作關係應該會成為博弈均衡並且被普遍接受而變成穩定製度。現在問題進一步明確為:什麼是可能比TFT更具真實性甚至更有優勢的策略?是否存在這樣的策略?
根據真實世界,必須考慮人生的有限性。人生是人們對事物進行估價的一個最重要指標,它限定了有效“未來”的實在意義。假如人壽千年,未來的分量變得如此之重,人們就更容易合作,但事實上人生苦短,偶然機遇稍縱即逝,“背叛”就是巨大誘惑。那麼,什麼樣的關係才能抵制背叛的誘惑?我們不能寄希望於倫理規範,對於大多數人,倫理規範從來只能抵抗微不足道的誘惑,甚至連這一點也是可疑的,事實上大多數人更可能見利忘義,而且是見小利而忘大義。真正抵抗住誘惑的是法律,是懲罰而不是獎賞。何況倫理也是合作的成果而非給定的前提,因此不可以預支倫理。顯然,我們需要尋找的是一個即使在充分自由(不擇手段)的情況下仍然能夠形成合作進化的策略。於是,剩下的唯一可能性是,如果S是最優策略,它就必須能夠形成一種同步對稱的利益互相依存關係(標記為SS):如果博弈者X或Y中任何一方獲得正面回報,另一方也必定連鎖地同時獲得正面回報;如果X或Y中任何一方獲得負面回報,另一方也必定連鎖地同時獲得負面回報。SS應該是唯一絕對保險的合作策略,在任何可能世界中都能夠建立穩定合作,尤其能夠避免博弈論擔心的“最後的背叛”這種沒有機會報復的致命一擊。在SS中,沒有人能夠通過背叛獲得任何利益,如果背叛就會反身挫敗。SS策略有兩類,正面SS和負面SS,都同樣重要。不幸的是,負面SS似乎比較容易形成,現成例子就是兩個擁有“確保互相摧毀”核武器的國家之間幾乎不可能發生全面戰爭,但這只是一種消極的合作。要形成正面SS,即互相成全、互惠雙贏,則難度較高。
對於建立一個好社會,正面和負面的SS都是必要的,分別用於發展利益和確保安全。為了使SS能夠順利形成,有效的對話是必要的。人們需要確定在哪些具體事情上可以形成SS,需要有效的試探和協商活動來確定別人也同意如此這般的策略,也就是需要達成SS的足夠信息。於是,事先的對話就成了唯一合理的試探性行為,在這一點上哈貝馬斯是對的。但哈貝馬斯的對話遊戲包含一些不切實際的要求,因此只好放棄哈貝馬斯式的“理想說話環境”而尋找另一種要求比較低而更現實主義的“有效對話環境”。要求不能太高,這是一個重要的生活原理。只要對話雙方各自提出明確要求,就足夠了,至於“真實性”、“真心”和“正當”,都是過高的要求。事實上,明確的信息正是博弈者真正需要的,有了明確的信息就足以在其範圍內查明是否存在SS合作的可能性。
何種條件能使人們決心建立雙方利益絕對掛鉤的關係即SS策略?對於這個問題,要找到完美解決,恐怕難以斷定,相對最好的答案應該是一個久經考驗的傳統觀點,即“和”策略。和策略最早是周朝政治家提出的,是從屬於天下體系的一個重要策略,主要用於“協和萬邦”(《尚書·堯典》),相當於所謂全球治理,但立志更為高遠,和策略有助於定義一種化敵為友的政治概念。遠古文獻有限,和的概念未見清楚界定。最有參考價值的理解來自春秋時關於“和”的爭論,至今富有學術意義,轉換為當代學術語言可以表達為:給定世界的多樣差異狀態,差異可能誘發衝突,於是至少存在兩種可能的解決方案,一是“同”,即消滅差異實現大一統。但普遍主義只在真理範圍內是合理性的,對於價值領域,普遍主義卻導致不良的存在狀態,因為“同則不繼”,任何事物都不可能在失去多樣性的環境中存活;另一方案是“和”,即在承認多樣性的前提下在差異中尋找並且建立相互利益最大化的協作關係,這是在存在論上合理的策略。其中的關鍵論證是這樣的:(1)事物之間的和諧是任一事物能夠生存的必要條件。一種事物單靠自身不可能生存,任何事物都不得不與其他事物共存而得以存在,這意味著,共存(co-existence)是存在(existence)的存在論條件,或者說,存在論總是共在存在論;(2)各種事物只有在互相配合之中才能使任一事物達到其最大的可能價值,事物間或人之間的相成關係將使任何一方的利益都獲得改善,並且在相互改善中每一方的收益最大值大於獨自改善的收益最大值。經典表述是:“和乃生,不和不生”[13];“夫和實生物,同則不繼。以他平他謂之和,故能豐長而物生之,若以同裨同,盡乃棄矣……聲一無聽,物一無文,味一無果,物一不講”[14]。
據此可以把SS策略進一步明確為“和策略”:(1)對於任意博弈方X,Y,和諧是一個相成互惠均衡,它必然使得,X獲得其應得利益x,當且僅當,Y獲得其應得利益y,同時,X如果受損,當且僅當,Y也受損,反之亦然;並且(2)X獲得利益改進x+,當且僅當,Y獲得利益改進y+,反之亦然。結果是,促成x+出現成為Y的優選策略,因為Y為了達到y+ 就不得不承認並促成X獲得x+,反之亦然。在“和策略”的相成互惠均衡中所能達到的各自利益改進均優於各自獨立所能達到的利益改進,因為那些對於每個人的生存極其重要的利益絕非個人或單邊力量所能獲得,所以合作是必需的,所謂“不和不生”。從邏輯結構上看,“和策略”是一個互為條件的關係,相當於邏輯的互蘊關係。
“和策略”的要求比較苛刻,它需要存在著各方都可接受的利益改進,而“都可接受”是很難滿足的條件,雖然比羅爾斯追求的“一致同意”容易一些,但仍然很不容易。準確的說,和策略比帕累託改進的要求更高。人們不可能滿足於帕累託改進,問題在於,帕累託改進遠不足以保證每個人的幸福,甚至不能保證多數人的幸福,因此無助於消除衝突而建立合作。帕累託改進與經濟學喜歡說的“把餡餅做大”的觀點是一致的,毫無疑問,當財富“餡餅”做得足夠大,對大家都有好處,至少沒有壞處,但物質上的好處未必能夠消除所有問題。可以考慮一個“心理學餡餅”問題:當帕累託改進僅僅改善了某些人的利益而維持其他人的利益沒有受損,或者所有人利益都獲得改善,但某些人的利益改善程度明顯不如其他某些人的改善那樣大,那些利益改善很小的人們就未必感激變大了的“經濟學餡餅”,因為人們還需要“心理學餡餅”。如果在“心理學餡餅”上之所失大於在“經濟學餡餅”上之所得,人們就不願意合作了。經濟學僅僅考慮生存所需要的物質利益而忽略心靈所需要的精神世界,這樣恐怕不能解決衝突與合作的問題。只有“和策略”才能達到人人滿意(不是平均主義,只是按公正比例受益),不僅在“經濟學餡餅”上人人滿意,而且在“心理學餡餅”上人人滿意。假如與艾克斯羅德的合作原則“自己活也讓他人活”(live-and-let-live)作比較,“和策略”則是一個強化合作原則,表現為“自己活當且僅當他人活”(live-iff-let-live)而且“自己發達當且僅當他人也發達”(improved-iff-let-improved)[15]。為了表達對孔子的敬意,我願意把這裡所定義的“和策略”利益改進稱為“孔子改進”。
關於“和策略”,未決的問題是:(1)“和策略”是否能成為解決任何衝突問題普遍適用的模式?這一點還沒有充分理由可以證明。從邏輯上看,估計有些衝突是和策略無法解決的,比如零和博弈的衝突就恐怕在任何意義上不存在合作解,只好你死我活或者退讓迴避零和博弈;(2)最能保證“和策略”的客觀條件是存在著某些巨大而可分享的共同利益,尤其是,各人所能分享的共同利益大於或重於各人所能獨佔的私人利益。這種情況不少但並非普遍現象,因此,在共同利益不足以壓倒私利誘惑的情況下就無法形成合作。這也正是人類一直無法克服的一個根本困難,即共同利益敵不過私利、長遠利益敵不過當前利益。令人失望的是,造成這種根本困難的原因不是別的,正是人性本身的缺陷,不僅是感性的缺陷,尤其是理性的缺陷,即使在共同利益大過私利、長遠利益好過眼前利益的時候,多數人仍然算不清帳;(3)另一個足夠誘導人們選擇“和策略”的客觀條件是存在著明顯的互補利益。但是,是否存在著互補利益的判斷以及對互補利益的評估需要理性對話,而有效的理性對話又需要人們對各種形勢各種事情有著正確認識,而“正確的認識”是很難達到的——正如蘇格拉底指出的,如果人們真的有了正確知識就不會犯錯誤了,可問題是人們總是沒有正確知識。
這裡的結論是,能夠形成最優合作的“和策略”在理論上有能力解決或減少衝突的各種困境,包括最典型的囚徒困境、搭便車、公地悲劇以及反公地悲劇等困境,但由於人性本身的缺陷以及實踐條件上的侷限性,在實際上無法普遍地形成“和策略”,因此實際上至多能夠減少減弱但不可能消除上述的各種典型困境。這一點雖然令人失望,但至少清楚地說明了:任何試圖通過知識論上的發現去徹底解決人類衝突與合作問題的努力是徒勞的,無論人們多麼理性,都不可能徹底解決衝突問題,或者說,理性終究是有限的,人類要改善命運,很可能還是不得不求助於根基從來不穩的道德。更嚴重的是,現代價值觀的根基更不可靠,一切以個人為準的現代價值觀沒有改善人性,反而張揚強化了人性弱點。可能需要再次“重估一切價值”了。
註釋:
[1](美)肯·賓默爾著,王小衛、錢勇譯:《博弈論與社會契約》第一卷,上海財經大學出版社,2003,§1.2.4.
[2]荀子:《荀子/禮論》:“人生而有欲,欲而不得,則不能無求,求而無度量分界,則不能不爭,爭則亂,亂則窮,先王惡其亂也,故制禮義以分之”。
[3] Rawls: A Theory of Justice.Cambridge,Massachusetts, the Belknap Press ofHarvardUniversityPress. 1971, p. 137.
[4]類似的智慧可以參考宋朝張詠公斷“兄弟分家產”的故事:兄弟分家,哥哥主持分家,弟弟認為少分了,哥哥不承認,張詠說,其實解決方法很簡單,哥哥的財產和弟弟的全部對換就可以了。
[5]石元康:《羅爾斯》,廣西,廣西師範大學出版社,2004。pp91-97.
[6] Rawls: A Theory of Justice, 1971, p.302.
[7](美)艾克斯羅德著,吳堅忠譯: 《合作的進化》,上海人民出版社,1996,p.3.
[8] R. Axelord: Effective Choice in the Prisoner’s Dilemma. Journal of
Conflict Resolution. 24: 3-25. 1980.
[9] Habermas:Moral Consciousness and
Communicative Action.Cambridge,UK, Polity
Press, 1990. p.89.
[10](德)哈貝馬斯著,曹衛東譯:《交往行為理論》第一卷,上海人民出版社,2004,pp.99-100.
[11]我關於“理解不能保證同意”這個命題的論證參見Understanding and Acceptance, 載《les Assises de la connaissance reciproque》,France,Le Robert, , 2003.
[12]從齊美爾、盧曼到福山等人有關於信任的研究。許多關於信任的解釋其實只是解釋了信任的積極作用,例如盧曼發現,信任是對社會事務複雜性的簡化機制。許多經濟學家也認為信任可以降低交易成本。
[13]《管子·內業》。
[14]《國語·鄭語》。
[15]孔子的原始表述是:“己欲立而立人,己欲達而達人”。見《論語·雍也》。