火山引擎的雲長什麼樣,看看這場大會就知道

火山引擎的雲長什麼樣,看看這場大會就知道

01

發力AI大模型訓練服務,火山引擎原動力大會引關注 

4月18日,字節跳動旗下的雲服務平臺火山引擎在其舉辦的“原動力大會”上重磅發佈了多款雲產品,其中,全新升級的機器學習平臺憑藉領先的性能和基於抖音大規模機器學習工程實踐的經驗而格外受到外界關注,也顯示出火山引擎致力於成為AI大模型訓練發動機的決心。

火山引擎自研DPU發佈

作為雲計算和數字化領域的頭部盛會,火山引擎原動力大會延續了“敏捷迭代”“數據驅動”“體驗創新”的增長三要素。除了技術驅動極致性價比,開放共享和業務價值驅動也是火山引擎始終堅持的做雲服務的理念。

值得注意的是,火山引擎此次發佈的多款技術產品已經被實際應用到這場發佈會中,貫穿整個大會,並取得了較為驚豔的效果。火山引擎原動力大會上究竟採用了哪些科技與狠活兒,電腦報記者帶你一探究竟。

02

技術成果與應用零距離接觸

在這次大會開始之前,電腦報作為受邀人,在填寫報名信息後就可以自動生成漫畫風格頭像邀請函。儘管對科技圈人士來說,這已經是比較普遍的多模態生成技術的應用了,市面上基於AI算法、輸入文字或圖片即可生成相應的高質量圖片的產品並不少,但火山引擎的優勢在於這一智能繪圖產品性能更強可以更快速的出圖。

火山引擎AI團隊基於Stable Diffusion模型,利用自研Diffusion Model蒸餾算法,減少了採樣步數,顯著降低了推理耗時,因此其智能繪圖相對於官方基準模型的出圖速度可以提升4~8倍,且效果更加精細穩定。        

火山引擎在生成式AI賽道的應用

經過AI算法生成的漫畫風格圖片   

這種效率的提升首先就應用在了字節旗下的社交短視頻平臺上——去年在抖音上走紅的“AI繪畫”特效,從啟動到上線只有一週左右,模型訓練僅由一名算法工程師完成,生成圖片的速度已經能控制在5秒左右。通過採用DataFinder增長分析平臺為邀請函埋點,火山引擎還能通過數據分析,瞭解受邀客戶對最新技術及火山引擎產品的關注度。

拍視頻、拍Vlog是網絡原住民們記錄生活的最佳方式之一,在大會現場,媒體參與者可以直接通過“智能硬件拍攝+雲端剪輯”的方式,享受高精度“自動打卡”視頻成片。不僅降低了用戶拍攝Vlog的硬件和技術門檻,還可以直接連接抖音集團旗下的短視頻平臺,發佈成片,這也是火山引擎音視頻雲端一體解決方案的充分展示,對於文旅、營銷、城市文化等行業,這一方案有助於提升遊客和用戶的場景體驗,打造文化IP,提升品牌宣傳效果。  

音視頻技術降低Vlog拍攝門檻 

在一些不經意的角落也可以看出火山引擎在算力調度上的經驗優勢。會場中,參會者可以隨時看到展區即時的人流熱力圖、曲線等,這都是利用展區部署的攝像頭對展區人流量及重點區域停留時間進行識別與分析得到的,利用的都是邊緣雲基礎設施。據瞭解,以上技術未來可以面向更多邊緣領域的業務場景,比如物聯網提供服務等等。

邊緣雲的應用

本次大會十幾場主題演講和論壇分享會的直播更能展示出火山引擎在音視頻技術上的積累。大會的直播間裡,火山引擎視頻雲、火山同傳、全站加速等產品相繼上陣,無論是在現場還是在線上都能獲得高清流暢的參會體驗。

火山引擎總裁譚待認為,我們現在所處的時代,可以被劃分為“超視頻”時代,互聯網用戶對視頻有了更極致的需求,不再僅僅滿足於清晰流暢的觀看體驗,而是對高清化、交互性、沉浸式的體驗有了更多訴求。

據瞭解,在2022年抖音世界盃直播中,火山引擎支持了累計106億人次的直播觀看,決賽直播觀看人數更是高達2.3億;更高清方面,火山引擎通過自研BVC編碼器與智能編碼方式,大幅提升直播畫質;互動方面,火山引擎通過RTC開拓了邊看邊聊互動模式,通過SFU+MCU融合方案,同時兼顧好了用戶規模和互動體驗;更沉浸方面,火山引擎支持了PICO的VR直播,基於全真超清顯示技術,讓觀影清晰度提升50%。

隨著需要處理的數據體量不斷攀升,音視頻應用對計算和存儲架構性能的要求也日益嚴苛。尤其在高吞吐量、大數據量請求的場景下,需要尋求一種可以經濟高效地擴展容量同時又不影響系統性能的方案。

火山引擎則在架構探索出了一條創新路徑——通過端雲一體的整體架構,從邊緣基礎設施的支撐、計算+網絡的數字基礎服務到視頻雲的應用解決方案提供生產、存儲、處理到分發的全棧能力。

在大會中,火山引擎也帶來6款音視頻方向的新產品和相關升級:火山引擎雲遊戲產品,提供面向雲遊戲渲染、試玩和互動的一站式服務;創意互動Vlog,提供全新高精度拍攝和自動成片技術;升級AR互動營銷方案,優化AR try-on和AR互動能力,打通抖音廣告和電商;WTN(WebRTC傳輸網絡),幫助客戶實現高清、實時的線上互動體驗;升級數字人產品,增加支持十多種“外語”,生成趨近於真人的數字分身;音視頻雲端一體解決方案veVOS,周級別內即可完成應用上線。

文物修復同樣需要視頻雲的算法技術支撐 

以近期火山引擎攜手PICO技術支持古籍活化的VR互動紀錄片《古籍尋遊記》為例,為了保護文物,火山引擎視頻雲可以採用神經輻射場技術,在不傷害文物的低噪情況下,掃描重建出文物的三維結構。

據瞭解,這類VR視頻製作中,空間建圖是行業的一個難題,除了模型本身的結構會更復雜,質感想做好也很難。在重建敦煌石窟場景的過程中,火山引擎視頻雲團隊由於具備基於視覺、RGBD數據集,以及多模態數據作為支撐,只需要掃描視覺數據,再融合應用SLAM、深度學習等技術,就能對場景及其細節進行更快速和精準的復刻。  

與火山引擎發佈的機器學習平臺經過抖音等海量用戶業務長期打磨的邏輯相同,火山引擎原動力大會上各項技術的落地亮相,很好地呼應了火山引擎對自己的介紹:將字節跳動快速發展過程中積累的增長方法、技術能力和應用工具開放給外部企業,幫助企業構建用戶體驗創新、數據驅動決策和業務敏捷迭代等數字化能力,實現業務可持續增長。

作為一朵“新雲”,火山引擎區別於其他廠商的路徑其實很明晰,如譚待所言:“不管是今天還是未來,我們都會圍繞著敏捷迭代、數據驅動和體驗創新這三個要素去構建產品服務體系”。秉持這樣的理念,在AI大模型推動雲上創新的大趨勢下,火山引擎能否借力彎道超車,讓我們拭目以待。

撰文/ 張書琛 

編輯/ 崔   崔

Scroll to Top