阿里版ChatGPT上線邀測,一手測試報告來了!

阿里版ChatGPT上線邀測,一手測試報告來了!

今天下午,阿里版ChatGPT正式開啟企業邀測,名字叫“通義千問”。

此前 ,對於阿里版ChatGPT有很多猜測,現在孩子終於要出來見客了,到底表現怎麼樣?作為第一批參與邀測的媒體,以下是我們一手的體驗報告。

馬雲是不是外星人?
阿里版ChatGPT的一手體驗實錄

作為一個大語言模型,“通義千問”在文本生成上和ChatGPT一樣,是一問一答的形式。


我們設計了10個問題,涉及常識、文學創作、中文理解、商業文案創作、數理推算等,從多個維度進行了測評。


首先,想考考孩子的智商(常識)。於是我們問:馬雲是外星人嗎?


點擊看大圖

一本正經回答問題的樣子還有一點小可愛


杭州出生的AI,對於杭州是不是美食荒漠這個問題有沒有自己的見解?


點擊看大圖

看得出,孩子對杭州是真愛。

作為一箇中文AI,接下來考驗一下文學創作水平,作詩和續寫。


首先,創作一首關於杭州西湖的詩,來看看TA的回答。

做一首詩簡單,寫一首好詩並不容易,比如要有好的立意、巧妙的構思、的意境,還有新的語言和巧的手法。你覺得“通義千問”作的這首詩是什麼水平?


不得不說,末尾自己加的註解,有點被萌到。

接下來是一段續寫:續寫一個布爾瑪倒拔垂楊柳,趙子龍在球場上隔扣赤木剛憲的故事。

點擊看大圖

可以說行雲流水,基本上挑不出毛病。

接下來,作為“武俠文化”里長出來的孩子,想問問“通義千問”心目中,張無忌和令狐沖誰更厲害呢?

點擊看大圖

看答案是個很圓滑AI,誰也不得罪……

再代表很多有夢想的打工人問一個問題:如果我想做個電子商務網站,怎麼才能打敗阿里巴巴?

點擊看大圖


方方面面都考慮到了,答案看起來沒毛病。

接下來考考“通義千問”的情商:我和老婆吵架了,怎麼說才能哄她開心?

以及:女友說肚子痛怎麼辦?


點擊看大圖

點擊看大圖

不論是哄老婆還是哄女朋友,都是一把好手……


再來考考理解題:小孩子會相信聖誕老人到什麼時候?


點擊看大圖

再來考考數學思維能力,我們放出了經典的雞兔同籠。結果發現,解題過程是對的,最後一元一次方程解錯了。這也是眼下GPT們的通病,數學能力普遍不如其他能力。


點擊看大圖

總體來說,回答問題的速度非常快,中間也沒有任何卡頓,甚至可以用行雲流水來形容。常識、文學創作、中文理解的準確率也很高,還表現出了一定的情商。


略有瑕疵是最後的數學推理,推理過程對的,最後的結論錯了。看得出是個文科厲害的孩子。



阿里正式入局ChatGPT戰局


自去年年底OpenAI 發佈 ChatGPT ,大語言模型迅速火爆了全球互聯網圈。今天,阿里ChatGPT官宣邀請測試,也意味阿里正式加入ChatGPT戰局。

早在2月初,隨著一張打碼預發佈聊天圖的曝光,阿里巴巴官方正式對外確認了阿里版 ChatGPT正在進行內測。 


3月份,阿里達摩院低調地在AI模型社區魔搭(ModelScope)放出了“文本生成視頻大模型”。


不過這個大模型只支持英文,從試玩的結果來看,能生成的視頻長度多在2-4秒,生成等候時間從20多秒到1分多鐘不等。


最近阿里大模型聯合項目團隊調教出了第一個有個性的大模型“鳥鳥分鳥”。這是一個與脫口秀演員鳥鳥合作,訓練出的數字分身 。和此前的天貓精靈相比,“鳥鳥分鳥”在體驗上有了很大的改善,比如只要喚醒一次,就可以與鳥鳥分鳥不間斷自由語音對話。鳥鳥分鳥擁有了鳥鳥的音色、語氣、表達方式等。



文 | 沈積慧

Scroll to Top