行業(yè)主要上市公司:阿里巴巴 ( 09988.HK,BABA.US ) ; 百度 ( 09888.HK,BIDU.US ) ; 騰訊 ( 00700.HK, TCEHY ) ;科大訊飛 ( 002230.SZ ) ;萬興科技 ( 300624.SZ ) ;三六零 ( 601360.SH ) ;昆侖萬維 ( 300418.SZ ) ; 云從科技 ( 688327.SH ) ;拓爾思 ( 300229.SZ ) 等
本文核心數(shù)據(jù):場景結構比重 ;
多模態(tài)大模型應用場景結構
賽迪四川研究發(fā)現(xiàn),從多模態(tài)大模型的應用場景來看,相較語言大模型賦能行業(yè),多模態(tài)大模型更加偏重落地場景,商業(yè)變現(xiàn)路徑更加清晰。多模態(tài)大模型企業(yè) 20 強中,應用場景可劃分為 11 類,成熟度相對較高且最受關注的前 5 個場景分別為數(shù)字人、游戲、廣告商拍、社交媒體和智能營銷。
多模態(tài)大模型讓數(shù)字人呈現(xiàn)更逼真
多模態(tài)技術為數(shù)字人提供了強大的核心能力,包括語言生成、語音合成、視覺呈現(xiàn)和跨模態(tài)協(xié)同。通過自然語言處理 ( NLP ) 技術,數(shù)字人能夠準確理解語義并生成流暢自然的語言回復 ; 利用語音合成技術,數(shù)字人具備生動的語音表達能力,并支持多語言和語調調節(jié) ; 在視覺呈現(xiàn)方面,基于圖像和視頻生成技術,數(shù)字人能夠展現(xiàn)逼真的面部表情、肢體動作和動態(tài)表現(xiàn)。同時,數(shù)字人通過整合文本、語音、圖像等多種模態(tài),提供高度自然的互動體驗,顯著提升人機交互的質量和效果。
多模態(tài)大模型提升游戲交互體驗
多模態(tài)大模型為游戲娛樂提供的核心能力包括自然語言理解與生成,多模態(tài)技術結合自然語言處理 ( NLP ) ,使游戲角色能夠理解玩家的語言指令,并進行情景化、語義相關的自然語言回復,增強沉浸感。語音交互與生成,指借助語音合成技術,游戲中的虛擬角色能夠生成生動、情感豐富的語音表達,支持語調調節(jié)和多語言輸出。圖像與視頻生成,是利用多模態(tài)技術生成逼真的角色形象和動態(tài)場景。游戲中的場景、物品、任務等可根據(jù)玩家行為動態(tài)生成,確保內(nèi)容的獨特性和互動性??缒B(tài)協(xié)同與動態(tài)輸出,是結合多模態(tài)感知與生成技術,游戲系統(tǒng)可以根據(jù)實時輸入 ( 如語音、動作 ) 動態(tài)調整輸出內(nèi)容 ( 如場景變化或情節(jié)分支 ) 。最后是沉浸式體驗優(yōu)化,支持玩家通過語音和動作輸入與虛擬世界互動,增強玩家對游戲環(huán)境的代入感。
多模態(tài)大模型使廣告商拍更高效
多模態(tài)技術通過智能創(chuàng)作、精準投放、沉浸式互動和實時優(yōu)化,為廣告傳媒行業(yè)賦能,實現(xiàn)內(nèi)容生產(chǎn)自動化、廣告?zhèn)鞑€性化以及用戶參與深度化,推動廣告行業(yè)向高效化和智能化轉型。多模態(tài)大模型推動廣告?zhèn)髅叫袠I(yè)從內(nèi)容創(chuàng)作到投放管理的全面智能化轉型,顯著提升創(chuàng)意生產(chǎn)效率、用戶體驗和投放精準度,同時拓展了品牌傳播的互動性與沉浸感。
多模態(tài)大模型提升社媒商業(yè)化效果
多模態(tài)大模型正在重塑社交媒體行業(yè)的各個層面,推動了內(nèi)容創(chuàng)作、用戶推薦、互動體驗、社區(qū)治理以及商業(yè)化的智能化轉型。通過高效的數(shù)據(jù)處理和深度的情感理解,社交平臺能夠提供更加個性化、精準和豐富的用戶體驗,同時提高平臺運營效率和商業(yè)化效果。
來源:前瞻網(wǎng)