【世界知識】張嵐舒:​ChatGPT風起向何方

【世界知識】張嵐舒:​ChatGPT風起向何方

 點擊 世界知識  關注並星標

每天與你一起

平實理性看世界

2022年11月30日,一款名為ChatGPT的應用程序橫空出世,上市五天後用戶即破百萬,僅用了兩個月時間便在全球收穫1億月度活躍用戶,取代TikTok(抖音國際版)成為史上增長最快的消費者應用程序,每天有超3000 萬人使用。與之對話的新奇體驗及其帶來的行業變革潛力更是持續引發熱議。ChatGPT何以成為現象級應用,又正在全世界颳起怎樣的風暴呢?

2023年3月16日,OpenAI首席執行官山姆·阿爾特曼在其個人社交平臺上發佈GPT4多模態模型片段。

何為ChatGPT

ChatGPT是由總部位於舊金山的初創公司 OpenAI 開發的一款聊天機器人,原理是基於“自迴歸語言模型”(Auto-Regressive Language Model),即一種基於深度學習的自然語言處理(NLP)工具,用於生成自然語言文本。從語義上看,chat在英語裡是“聊天”之意,GPT則是“Generative Pre-trained Transformer”(生成型預訓練變換模型)的縮寫,屬於一種基於互聯網可用數據訓練的文本生成深度學習模型。

ChatGPT是OpenAI開發的GPT系列模型中的GPT-3.5版本。這是一種參數上億的大模型,採用了RLHF(Reinforcement Learning from Human
Feedback,人類反饋強化學習)技術用於模型訓練,加入了更多人工監督對模型生成的結果進行大量微調。簡單來說,ChatGPT的誕生過程就像不斷在教一個基於深度神經網絡的機器大腦理解人類世界的知識和語言,並根據模型中已有的海量知識儲備生成合理內容,實現內容輸出與人互動的功能,又通過不斷對這些內容進行人工反饋校準,不斷提高內容呈現的質量和水準。4.0版本的ChatGPT支持圖像和文本輸入,能生成文本結果。ChatGPT就像一個能協助人類完成各種文本任務的“助手”,可以實現自動文本生成、自動問答、自動摘要,甚至具備編寫和調試計算機程序的能力。

有何特別

ChatGPT表現出優越的技術能力。在ChatGPT開放註冊前,市面上已有許多具備聊天回覆功能的機器人工具,這類工具往往作為智能手機、電腦等智能設備的智能模塊,可以實現使用者與智能設備功能相匹配的指令需求。在設備本身的功能框架下,這類程序在需求識別方面具有比較大的侷限性,比如車載設備往往只能實現駕駛情境下的各種應答需求,且應答較為程式化。而ChatGPT沒有設備框架限制,僅作為一個“幾乎裝載了整個世界的知識量”的大模型存在。

市面上的大模型動輒具有數百億、千億甚至萬億級的參數體量,ChatGPT的模型參數也超過了1750億。OpenAI使用了45TB的數據、近1萬億個單詞、10萬輪以上的人類反饋來訓練該模型。進入市面後,ChatGPT還通過搶先公測,收集了大量用戶的使用數據來不斷改進模型效果。最終,ChatGPT在驚人知識量、大量時間堆砌訓練、大量人力反饋修正以及優越算法共同加持下,能準確識別用戶的廣域問題,為用戶提供十分人性化的答案,看上去比以往出現的各種問答程序都更加“聰明博學”,極大提升了用戶與人工智能互動的體驗感。ChatGPT甚至可以通過谷歌L3軟件工程師的入職面試,並在美國執業醫師資格考試取得“合格”或“接近合格”的成績。因此,《紐約時報》稱其為“有史以來向公眾發佈的最好的人工智能聊天機器人”。

ChatGPT擁有可觀的商業化前景。ChatGPT自推出以來就受到資本市場追捧。截至2023年2月8日,A股市場ChatGPT概念板塊在一週時間內上漲超過20%。這得益於其三類重要的商業化特質。一是輕量級。ChatGPT打破了以往“嵌入式”人工智能的框架感,直接回答、執行文本任務的運行模式相對“單純”,從“付費享有回答”到“定製應答服務”,均沒有脫離輕量型的人工智能生成內容商業模式基礎。二是快傳播。ChatGPT一經推出即商業化,其新奇而豐富的使用感直接掀起以用戶為主體的體驗型宣傳分享熱潮,加之媒體持續關注和挖掘亮點,使其快速積累大規模用戶,變現前景越發可觀。三是易融合。ChatGPT對既有產品體現出很強的融合性和增益性。例如,可與聯網汽車、智能電視等智能設備結合,發揮更“聰明”和“人性化”的能力,滿足用戶更為多元的內容需求。ChatGPT既自成一派,又具備廣闊的融合賦能場景。以上三類屬性很好地迎合了“快商業化”的資本與市場需求。 

本刊與百“文心一言”的對話截屏。

將帶來怎樣的影響

科技行業已經歷了20多年的高速增長期,尤其是疫情以來,以Meta等為代表的大型科技公司紛紛擴展線上業務,佈局具有新業態構想性特點的賽道。如今,隨著新冠疫情對線上業務限制的消退,以及通脹和經濟衰退預期的多重影響,科技行業正處於“迴歸基礎型服務、剪裁概念型服務”和重視降本增效提升盈利的調整期。ChatGPT的技術鏈短,獲取直接收益快,其走紅凸顯人工智能領域基礎服務型產品的巨大價值和發展潛力,促使科技行業爭相佈局類ChatGPT“實用”賽道。

在行業調整需求和現實成功案例的刺激下,科技巨頭紛紛加大對人工智能領域的投資,並呈現出三種傾向:第一類公司以微軟為代表,將類ChatGPT型產品應用作為原有產品賦能和“彎道超車”的抓手。ChatGPT已獲得微軟100億美元的投資,微軟已著手在其“必應”(BING)搜索引擎中加入聊天機器人的組件,內部版本正在測試。第二類公司以谷歌為代表,與微軟的“攻城”思路相反,其傳統搜索引擎優勢業務面臨ChatGPT這種“代為搜索整合答案”的業務模式挑戰。為此,谷歌斥巨資應對,宣佈將發佈20種新的人工智能產品,同時正在測試一個名為“巴德”(Bard)的聊天機器人,以同ChatGPT一爭高下。第三類公司以Meta為代表,其在元宇宙業務受挫而ChatGPT應用走紅後,宣佈2023年額外投入40億~50億美元,全部用於人工智能。此類企業試圖在現有業務增長與盈利雙重“鈍化”情況下,佈局短平快技術賽道以為自身業務注入活力。

除美科技巨頭外,中國的百度、阿里、網易有道、360和韓國的互聯網巨頭“領航員”等也紛紛啟動類ChatGPT的產品開發,加入“實用”賽道佈局競爭。2023年3月16日,百度正式發佈包括文學創作、商業文案創作、數理邏輯推算、中文理解、多模態生成等五大功能的“文心一言”(ERNIE Bot)。

從社會層面看,ChatGPT應用趨勢存在多種問題與風險。就技術本身的侷限性而言,ChatGPT目前以一定時間點之前的知識集合作為訓練物料,仍存在知識滯後的時間差,還面臨訓練數據來源合規性、知識盲區等諸多問題,這些問題必然會使ChatGPT生成的內容存在偏差,提供的答案看似正確,實則經不起考證,使用者的現實工作可能會因此引入錯誤,甚至助力虛假信息傳播。

ChatGPT已經引發對於知識產權、學術剽竊的擔憂。ChatGPT生成的內容如被用於學術創作,可能會侵犯他人的著作權。同時,即便所引內容並非剽竊,人工智能生成內容被個人使用也存在知識產權爭議。為此,全球多家知名學術期刊發佈規定,任何大型語言模型工具都不會被接受為署名作者。

從社會倫理的角度看,人們正在探討類ChatGPT應用的不斷進化是否會跳脫其生產工具屬性,佔據人類的勞動價值空間。教師、記者、作家、法務、市場分析師、程序員、美工設計等數十種職業崗位被視為人工智能技術取代風險最高的工作類型。

從國家安全角度看,類ChatGPT應用可“以指定傾向為標準選擇訓練物料”等方式塑造輸出內容,因此有可能被用作意識形態和輿論宣傳工具。此類應用也被質疑存在收集用戶信息和隱私洩露的風險,給數據監管帶來挑戰。

加劇國際競爭

ChatGPT的爆火將加劇各國在革命性科技領域的競爭。一方面,ChatGPT的底層技術並不新,但組合效果驚人,反映了其背後算法或技術組合方式的優越性。這實際是一種“技術+”的數字競爭路線,此類技術對更廣泛數字領域的賦能作用,將引領更多創新,成為驅動數字經濟新業態發展的動力。各國在看到ChatGPT迅速創造的技術效應和經濟前景後,必然加大在該領域的投入和佈局。

另一方面,ChatGPT背後反映了一整套數據資源獲取、創造和應用的高效模式,在“數據即戰略資源”的今天,ChatGPT等現象級技術應用的發展差異也必將從數據實力起始,向著行業變革驅動力、價值觀傳播力、規則標準引領力、治理模式推廣力等諸多層面傳導,對中美等國戰略博弈的走向產生影響。

(作者為中國現代國際關係研究院美國研究所助理研究員)


·  END  ·

本文刊登在《世界知識》2023年
第7期
責編:安剛
查看本期目錄
點擊左下角“閱讀原文”,購買本期
雜誌
覺得好看,請點這裡
Scroll to Top