繼微軟發佈了集成ChatGPT的新版必應,開始試圖挑戰谷歌在搜索引擎領域的市場領導地位後,谷歌為對抗ChatGPT,也針鋒相對的拿出了自家的對話機器人Bard。作為大名鼎鼎機器學習開源框架TensorFlow的開發者,谷歌在AI領域顯然也底蘊深厚,並且為了證明自己的技術實力更勝一籌,在宣傳中更是表示Bard不僅能與ChatGPT一樣做到有問必答,還要更“負責任”。
言下之意,無非就是ChatGPT的回答更“信口開河”、不太“負責任”。只可惜谷歌的這個Flag立得並不太好,Bard首次亮相就“翻車”了。由於在官方展示的動畫中出現了嚴重的事實性錯誤,不僅讓谷歌顏面大失,更讓直接使得其股價在2月8日大跌7.4%、市值瞬間蒸發千億美元,也創下了自2022年10月以來單日最大跌幅。
在關鍵產品的處子秀上,一個錯誤的展示案例卻能通過不同部門、不同職級的層層審批,並被展現在全球數億用戶面前,這背後反應的當然是谷歌在組織與運營上出現了問題。也從側面證明了,ChatGPT咄咄逼人的強勢表現確實讓谷歌方寸大亂,以至於上演了剛剛宣稱自己的產品更負責,轉眼就被“打臉”的劇情。如此這般,無疑才是讓投資者對谷歌抱以懷疑態度的關鍵所在。
而讓ChatGPT迅速點燃市場的,是其尤為擅長輸出看上去符合邏輯、像是人話的內容,也就是“說人話”,這就讓用戶有真的是在與“人”、而不是“機器”交流的感覺。但對於回答本身的正確性,ChatGPT或許並不看重的。事實上,Bard的首秀“翻車”也揭露了如今熱火朝天的AI對話機器人在底層上的頑疾,那就是“一本正經胡說八道”這個現象無法根除,可靠性難以得到保障。
要說在回答問題上“翻車”,ChatGPT其實更勝一籌,曾給出諸如《原神》是由騰訊開發的競技戰鬥遊戲、漢朝末代皇帝嬴政坑殺著名儒學家墨子、韓非子、項羽這樣的回答。而谷歌Bard也不遑多讓,這一次強行將第一批系外行星照片的殊榮冠給了2021年末才投入使用的詹姆斯·韋伯望遠鏡。所以不難發現,兩者的事實性錯誤可以說是不勝枚舉。
其實這一現象幾乎不可避免,也牽扯到了ChatGPT這類對話機器人的技術原理。據悉,ChatGPT是基於GPT-3.5大規模語言模型(LLM,Large Language Model)的基礎,再加入人工標註數據和強化學習技術,輔以知識圖譜技術,即一種將知識寫成結構化三元組(包含實體、概念和關係)的多關係圖,讓AI能夠理解人類指令的含義,並從龐大的數據庫中選擇相關內容進行回答。
簡單來說,也就是無論ChatGPT、還是谷歌的Bard,它能夠回答用戶的內容都是基於“喂”給它的數據,組成回答的形式也是從海量訓練參數中排列組合出來,只是根據用戶的問題以概率形式估計,並呈現最有可能出現的文字。那麼,如果訓練參數出現問題呢?其實數據投毒攻擊(Data Poisoning Attack)已經是一個AI領域不可迴避的問題。
傳統的網絡攻擊是通過發現漏洞、再編寫代碼來實現,而AI領域的攻擊行為則更難防備,因為給數據庫貢獻參數幾乎是每一個AIGC平臺都歡迎的行為。據相關研究人員在HITCon安全會議中透露的數據,只需“毒害”不到0.7%提交給機器學習系統的數據,就可以完全繞過防禦,進而全面降低模型的準確率。
最典型的案例,就是有用戶在對微軟小冰等傳統對話機器人進行“誘導”,通過語言實現誘使這類產品說髒話,甚至發表敏感言論的目的。以至於曾經出現過,谷歌的AI程序將YouTube上國際象棋視頻中的黑棋白棋,識別成黑人白人的情況。畢竟用謊言去驗證謊言得到的一定是謊言,如果數據集中的參數本身就有問題,得到的回答自然是錯漏百出的。
再加上,數據投毒的成本其實遠沒有想象中那麼高。不同於傳統網絡安全領域圍繞漏洞挖掘的攻防,其實是沙裡淘金的運氣遊戲,由於全球AI領域合作的緊密性以及高昂的數據成本,開源和共享極為普遍,只需要給AI模型植入惡意執行代碼,再上傳到開源社區,就能輕易汙染大範圍的數據供應鏈。
如果ChatGPT、Bard僅僅只是一個對話機器人,是以娛樂向為主,那麼出現一本正經的胡說八道也無傷大雅,但如果像微軟一般將ChatGPT集成到搜索引擎上,就有問題了。
要知道博學多才的人註定是少數中的少數,大多數人往往專精的領域十分有限,這就意味著對於非專業領域的信息求證成本很高。用戶相信搜索引擎能給出他們需要的答案,但是一方面AI的回答可靠性不高,另一方面AI的回答看起來又似乎很專業,勢必就會汙染整個互聯網的信息源。
引入科技來替代以前人類的工作,卻沒有能力來驗證可靠性,這其實就是如今ChatGPT和Bard的致命缺陷。在將ChatGPT引入Bing之前,微軟的策略相當聰明,以投資OpenAI的方式與ChatGPT保持了一定的距離,既享受到了紅利、又實現了與風險隔離。如今在新版Bing中集成了ChatGPT之後,微軟顯然就要與谷歌一樣對產出的結果承擔責任。
在谷歌已經因Bard“翻車”嚐到了市值一夜蒸發千億美元的苦果後,接下來或許就要輪到微軟了。
這款並未上市的索愛手機,隱藏著後續產品的諸多細節設計。