2023年可以說是人工智能破圈的元年,從自然語言文字對話到文字生成圖片,甚至文字生成短視頻。人工智能在消費端的玩法越來越多,但隨著熱潮褪去,冷靜下來的我們也發現,只靠新鮮感並不能長久地吸引用戶,對於入口定位C端的人工智能來說,場景落地就是這波熱潮真正應用落地的關鍵。
其中,智能終端的語音交互和視覺交互是C端最容易感知的場景,語音交互沒有年齡門檻,老人小孩都可以直觀使用,天貓精靈最近推出的IN糖3 Pro,就以199元的價格,直接敲開了初代AIGC硬件的大門。
01
接入阿里巴巴人工智能大模型
對話交互更像“人”了
在4月11日的2023阿里雲峰會上,阿里巴巴集團董事會主席兼CEO、阿里雲智能集團CEO張勇就提出了“面對AI時代,所有產品都值得用大模型重做一次”的口號。天貓精靈Sound Pro當時是第一個接入千問大模型的demo。而一個月後,天貓精靈又推出了IN糖3 Pro的大模型測試版本,這場AIGC+智能終端的序幕背後,覆蓋了越來越多的交互形態。
IN糖系列是天貓精靈一直以來的經典產品線,出貨量行業內領先,因為價格親民、交互數據豐富,一直以來都被業內人士廣泛認同為智能家居最好的入口,《電腦報》拿到的天貓精靈IN糖3 Pro 所採用的人工智能內容,評測版處於AIGC Demo階段,但表現上已經具備第一代AIGC硬件的雛形,讓雲端的一個個性化鮮活的大模型,融入到這臺消費智能終端之中。
通過和沒有接入大模型的老版本天貓精靈相比,可以從使用體驗中察覺到諸多不同。最核心的差別就是對話的連續性,IN糖3 Pro可以聯繫整段對話的前後文,進行有邏輯的回答,以下就是三年級小朋友和IN糖3 Pro關於“寫作文”的對話摘錄。
小朋友:天貓精靈,我想寫一篇作文
IN糖3 Pro:好的,你的作文主題是什麼呢?
小朋友:嗯,我想想,主題就是“春遊”吧!
這時候IN糖3 Pro就開始輸出作文了,這時候它寫作的主題是“去海邊”,但因為我們是內陸城市,所以春遊不可能去海邊,於是孩子打斷它:
小朋友:天貓精靈,我的作文主題不能是海邊,不如我們去爬山吧!
這時候天貓精靈會說“嗯,讓我思考一下”,然後開始重新輸出以爬山為主題的春遊作文,但因為它會持續輸出整篇文章,所以我決定打斷它,只讓它擬一個大概的提綱,剩下的讓孩子自己發揮,於是我說:
家長:天貓精靈,不要寫完整的文章,只給我一個簡短的提綱吧!
此時IN糖3 Pro就不再輸出完整的作文,而是簡短的擬了一個100字左右的提綱,孩子就在這個提綱的指引下完成了作文撰寫。整個過程都稱得上行雲流水,沒有機械式對話的感覺,在網絡通暢的情況下基本沒有延遲,效率很高。而作為對比,沒有接入人工智能大模型的傳統智能音箱就不具備這樣流暢的連續對話效果,經常會出現前言不搭後語,甚至無法理解用戶語義的情況。
以上的測試,三年級小朋友說的話其實並不像成年人那麼有邏輯,有時候會夾雜許多語氣詞,甚至會不斷說錯,不斷重新更正,對語音識別算法有較高要求。從我們的測試過程來看天貓精靈IN糖3 Pro也的確誤解過孩子說的話,但總體正確率很高,在可接受範圍內。
詢問貓精,想寫一篇作文
作文輸出中,孩子改變撰寫思路和貓精對話,後者實時調整寫作方向
再來一個關於最新大作《塞爾達傳說王國之淚》遊戲發售的對話,本遊戲在5月15日發售,玩家目前有很多不同的問題,拿來考考IN糖3 Pro:
編輯:天貓精靈,你知道塞爾達傳說嗎?
IN糖3 Pro:我知道,這是一個受大部分遊戲玩家喜歡的遊戲。
編輯:這個遊戲有什麼特點?
IN糖3 Pro:讓我思考一秒鐘,王國之淚是任天堂 Switch平臺獨佔遊戲大作,遊戲從海拉魯平原開始,進行探險……
沒等它說完,我們打斷了對話,強行植入另一個話題,模擬兩人多輪層次的交談
編輯:那和前代的曠野之息相比,王國之淚是不是要好玩一些?
IN糖3 Pro:我不認為這兩個遊戲對比哪個好有意義,它們都是很優秀的遊戲,有各自的特點……
編輯:那王國之淚的地圖包括哪些呢?
IN糖3 Pro:王國之淚包括地表世界、地底世界以及天空島的地圖。
IN糖3 Pro為用戶剖析任天堂新發售的遊戲大作《塞爾達傳說:王國之淚》
從交互性來看,精靈IN糖3 Pro擬人化程度更高,在我們停止輸入對話後,它才開始切入輸出新的回答。如果我們表達的內容讓機器出現識別偏差,再重新修正表達方式,終端才會進入新的對話,語言中偶爾也有一些玩笑詞語。
作為一個從ChatGPT就一直在使用AIGC,每週還要大量進行“文生圖”的人工智能老玩家來說,天貓精靈IN糖3 Pro給了我們很不一樣的啟示:此前我們大量使用的人工智能都是基於視覺的,無論文本、圖片還是視頻,但智能音箱主打的是語音,和文本提示詞不同,它需要理解人究竟在說什麼,也就是需要正確地將語音轉換文文本,同時給與大模型生成內容等待的時間也要更短,以抵抗用戶的“不耐煩”。
至於像“明天天氣如何,該怎麼穿衣服”這種問題就更是手到擒來了,甚至還可以問它"週末去哪兒玩”“XXX地方附近有什麼美食推薦”,它也能給出一些比較有參考價值的答案。
心情不好的時候我們還可以向它“求安慰”,比如問:“我不開心的時候可以做點什麼?”
IN糖3 Pro會給你一些暖心的建議:“跟老友聚一聚吧”,“健健身流流汗啦”等等,甚至還能繼續根據對話給出更細緻的建議,綜合來看的確可以滿足日常自然對話需求。
02
除了AIGC,智能家居老本行怎麼樣?
理想化的智能家居,是每個電器甚至傢俱都有自己的物聯網芯片,可以通過一個或多箇中樞來進行隨時隨地的控制,但現實生活中不可能每個家庭都能達到如此高的“智能化”,老家電的佔比依然很高,所以更符合現實的設計就是接管功能,這也正是天貓精靈IN糖3 Pro在AIoT領域習得的新本領,它可以學習紅外遙控器功能,即便是紅外碼庫外的老家電也可以學習,官方資料顯示覆蓋了3000多個主流家電品牌。
通過我們的測試來看,只需要在手機上打開天貓精靈App,選擇和格力空調潤享(2017年老家電)對應,它就會開始自動搜索並完成配對,需要花的時間因不同電器而異,短的幾秒,長的也就兩三分鐘,還是挺迅速的。
配對完成後,就可以喚醒內置的360°全向紅外發射器,對房間內剛剛配對的家電進行語音遙控了,比如發出“調到23度”的指令等等,完成降溫操作
而且在學習完成後我們又通過手機端的天貓精靈App遙控家電,比如操控易開得A9淨水器:在出水口放下水杯,發出語音:“天貓精靈,200ml的常溫水”,裡面就有28度的常溫水按毫升量準確流出,這個功能尤其適合家裡有老人小孩或寵物的家庭。
03
聲學優化,音量充沛嚼字清晰
因為智能音箱往往需要放在家裡比較顯眼的位置,所以外形設計也是需要細細考究的,天貓精靈IN糖3 Pro採用了類似經典錄音機的設計思路,圓潤的長方體身段長度不超20cm,高度不到10Cm,體型小巧簡約。兩個5W功率揚聲器朝前,中間是一塊顯示屏,頂部巨大的旋鈕方便調整音量,按下就能一鍵麥克風靜音,旁邊則是屏幕開關和藍牙連接按鈕,沒錯,天貓精靈IN糖3 Pro也可以當作一臺傳統藍牙音箱來使用,還可以用它接打電話。
從音樂播放效果來看,這款199元的音箱是完全值回票價。得益於一體腔設計專利,倒相式聲學結構有效提升音質,配合大音腔和HIFI模擬公放,讓大聲場可以充滿數十平米的空間而不突兀,低頻更自然。
用作語音對話,或者給孩子講故事、講知識、聊科普,機器“吐”字非常清晰。兩個頂置麥克風拾音效果可打滿分,我們在嘈雜辦公室內測試,距離1米用正常甚至私聊的低音量語音交互,也能喚醒機器並以較高的準確度識別命令。
顏色方面,天貓精靈IN糖3 Pro有黑色和白色兩種顏色可選,這種經典色系的環境適配性是很強的,唯一的遺憾就是黑色版的電源是白色的,如果可以實現同色設計就更容易融入環境了。
04
總結:第一代AIGC硬件真的要來了
智能音箱在過去幾年技術進步不明顯,大多在外觀上做文章,智能交互能力有限。而隨著人工智能大模型的快速發展,具備強理解能力的智能音箱很有可能開啟新一輪的智能終端熱潮,並擴充到更多場景之中。
5月19日,天貓精靈一款升級了AIGC的工程機智能眼鏡又在B站博主視頻中引發關注,意味著大模型具備有了從家庭中走到戶外、從桌面數碼產品變成隨身穿戴設備的想象空間。
深厚的用戶基礎,足夠多的交互數據,加上幾年來的工程、聲學積累,眼下正在形成正反饋,或突破近年來智能音箱細分領域疲軟的狀態,實現數據飛輪,是讓人工智能大模型更快“跑起來”的第一個檔位,其重要性不言而喻。天貓精靈具備了生成式大模型能力的硬件條件後,從語音助手變成更有情感的AI夥伴,讓人不禁好奇,未來的智能設備到底還能發展成什麼樣子呢?