阿里版ChatGPT上線邀測，一手測試報告來了！

今天下午，阿里版ChatGPT正式開啟企業邀測，名字叫“通義千問”。

此前，對於阿里版ChatGPT有很多猜測，現在孩子終於要出來見客了，到底表現怎麼樣？作為第一批參與邀測的媒體，以下是我們一手的體驗報告。

馬雲是不是外星人？

阿里版ChatGPT的一手體驗實錄

作為一個大語言模型，“通義千問”在文本生成上和ChatGPT一樣，是一問一答的形式。

我們設計了10個問題，涉及常識、文學創作、中文理解、商業文案創作、數理推算等，從多個維度進行了測評。

首先，想考考孩子的智商（常識）。於是我們問：馬雲是外星人嗎？

點擊看大圖

一本正經回答問題的樣子還有一點小可愛。

杭州出生的AI，對於杭州是不是美食荒漠這個問題有沒有自己的見解？

點擊看大圖

看得出，孩子對杭州是真愛。

作為一箇中文AI，接下來考驗一下文學創作水平，作詩和續寫。

首先，創作一首關於杭州西湖的詩，來看看TA的回答。

做一首詩簡單，寫一首好詩並不容易，比如要有好的立意、巧妙的構思、美的意境，還有新的語言和巧的手法。你覺得“通義千問”作的這首詩是什麼水平？

不得不說，末尾自己加的註解，有點被萌到。

接下來是一段續寫：續寫一個布爾瑪倒拔垂楊柳，趙子龍在球場上隔扣赤木剛憲的故事。

點擊看大圖

可以說行雲流水，基本上挑不出毛病。

接下來，作為“武俠文化”里長出來的孩子，想問問“通義千問”心目中，張無忌和令狐沖誰更厲害呢？

點擊看大圖

看答案是個很圓滑的AI，誰也不得罪……

再代表很多有夢想的打工人問一個問題：如果我想做個電子商務網站，怎麼才能打敗阿里巴巴？

點擊看大圖

方方面面都考慮到了，答案看起來沒毛病。

接下來考考“通義千問”的情商：我和老婆吵架了，怎麼說才能哄她開心？

以及：女友說肚子痛怎麼辦？

點擊看大圖

不論是哄老婆還是哄女朋友，都是一把好手……

再來考考理解題：小孩子會相信聖誕老人到什麼時候？

點擊看大圖

再來考考數學思維能力，我們放出了經典的雞兔同籠。結果發現，解題過程是對的，最後一元一次方程解錯了。這也是眼下GPT們的通病，數學能力普遍不如其他能力。

點擊看大圖

總體來說，回答問題的速度非常快，中間也沒有任何卡頓，甚至可以用行雲流水來形容。常識、文學創作、中文理解的準確率也很高，還表現出了一定的情商。

略有瑕疵是最後的數學推理，推理過程對的，最後的結論錯了。看得出是個文科厲害的孩子。

阿里正式入局ChatGPT戰局

自去年年底OpenAI 發佈 ChatGPT ，大語言模型迅速火爆了全球互聯網圈。今天，阿里ChatGPT官宣邀請測試，也意味阿里正式加入ChatGPT戰局。

早在2月初，隨著一張打碼預發佈聊天圖的曝光，阿里巴巴官方正式對外確認了阿里版 ChatGPT正在進行內測。

3月份，阿里達摩院低調地在AI模型社區魔搭（ModelScope）放出了“文本生成視頻大模型”。

不過這個大模型只支持英文，從試玩的結果來看，能生成的視頻長度多在2-4秒，生成等候時間從20多秒到1分多鐘不等。

最近阿里大模型聯合項目團隊調教出了第一個有個性的大模型“鳥鳥分鳥”。這是一個與脫口秀演員鳥鳥合作，訓練出的數字分身。和此前的天貓精靈相比，“鳥鳥分鳥”在體驗上有了很大的改善，比如只要喚醒一次，就可以與 “鳥鳥分鳥” 不間斷自由語音對話。鳥鳥分鳥擁有了鳥鳥的音色、語氣、表達方式等。

文 | 沈積慧

相關文章