如果沒有元宇宙的沃土,沒有二次元的追捧,一個個虛擬人將會以怎樣的方式闖入我們的生活?
現(xiàn)在,虛擬人真實地活躍在我們身邊,讓人們真切地感受到其商業(yè)價值。在這條“熱賽道”上,企業(yè)跑步入場,成功似乎變得唾手可得。這些虛擬人“出圈”,是因為性格還是外形?他們與人類在職場上是互補還是替代?企業(yè)“押寶”是為了引流還是變現(xiàn)?
“這是虛擬人嗎?”
“看她的掌紋和手背上的青筋,怎么可能是假的?”
“但她沒有瞳孔。”
幾個年輕人圍著一張手機上的照片,用指尖把它放到最大,仔細打量,努力判斷眼前這個紫發(fā)姑娘到底是不是個真人。她叫Rae,生日是10月17日,天秤座女孩,是一個虛擬偶像。Rae有著貓一樣的眼睛、雙眼皮、錐形鼻梁、豐滿的嘴唇、獨特的斷眉俏皮且神秘。她的“人設(shè)”是一個熱愛街頭文化的大膽的姑娘,富有表現(xiàn)力和時尚感。每到周末,她都會找個地方練習(xí)滑板技巧。因為喜歡滑板,她成為2021年中國滑板精英賽的虛擬推薦官。
在社交平臺上,Rae的自我介紹是“城市探索者”。有時,她也愿意稱自己為“數(shù)碼藝術(shù)家”。Rae有一只寵物Tako。這只長得像八爪魚的寵物站在Rae身邊時有一種反差萌。Rae在國內(nèi)的第一次亮相是在兩年前的生日那天,她在微博上發(fā)了一張頗具朦朧美感的單人照。這個紫發(fā)女孩每次亮相之前,背后都有十幾人為其服務(wù)。其運營團隊是上海想來想去文化傳媒有限公司,該公司總經(jīng)理王一寶告訴記者:“給Rae制作視頻的話,大概需要10天的時間,圖片制作也要3天左右。”
迭代升級
從“紙片人”到“立體人”
什么是虛擬人?目前,業(yè)內(nèi)人士對于虛擬人的定義引用了中國人工智能產(chǎn)業(yè)發(fā)展聯(lián)盟發(fā)布的《2020年虛擬數(shù)字人發(fā)展白皮書》中的釋義:虛擬人是指具有數(shù)字化外形的虛擬人物,依賴顯示設(shè)備存在,并且擁有人的相貌、人的舉止以及人的思想。
提到虛擬人,就繞不開初音未來。她是世界上第一個使用全息投影技術(shù)舉辦演唱會的虛擬偶像,曾在美國、墨西哥、印尼、新加坡等國家舉辦世界巡演,擁有6億“粉絲”,代言過上百個品牌。不過剛出道時,初音未來的智能程度還不高,只有人為設(shè)定的一些歌曲和動作,不能與人交流。“以往我們把初音未來、洛天依等歸于虛擬偶像,是因為那時沒有虛擬人這個概念。從去年開始,虛擬人已不局限于虛擬偶像這單一類型。”艾媒咨詢首席分析師張毅表示。
“虛擬人的發(fā)展并非一蹴而就的。在近20年的時間內(nèi),虛擬人隨著計算空間、計算平臺不斷迭代升級。”百度數(shù)字人業(yè)務(wù)相關(guān)負責人將虛擬人的發(fā)展歷程歸結(jié)為三個階段:第一階段是“紙片人”,一般是游戲或動漫公司發(fā)布虛擬形象,通過電子音合成軟件,使虛擬形象可以唱歌、跳舞,但用戶只能觀賞,無法與其進行互動;第二階段是人為驅(qū)動,這一個階段技術(shù)人員不只借由軟件做固定的編排,還可以通過設(shè)備實時驅(qū)動虛擬人進行演繹與互動;最后一個階段是虛擬人與人類的自主互動。當前,通過人工智能技術(shù),部分虛擬人可以具備聽懂外部內(nèi)容并實時反饋的功能。
目前所見的虛擬人大多通過操作人員來進行操控,比如直播間里的虛擬主播。也有虛擬人是由人工智能驅(qū)動,直接與人交互,比如萬科的“最佳員工”崔筱盼。資訊公司量子位發(fā)布的《虛擬數(shù)字人深度產(chǎn)業(yè)報告》顯示,到2030年,我國虛擬人整體市場規(guī)模將達到2700億元。
賽道成型
市場報價從十幾萬元到上百萬元
元宇宙的熱度打開了虛擬人的賽道。目前,我國虛擬人主要從事虛擬主播、數(shù)字員工、虛擬偶像、品牌代言人等職業(yè)。
數(shù)字員工屬于服務(wù)型虛擬人,可以為金融、零售等領(lǐng)域提供新型客戶服務(wù),解決排隊時間長、回應(yīng)慢、人力成本高等問題,并助力這些行業(yè)進一步實現(xiàn)智能化轉(zhuǎn)型。虛擬主播和虛擬偶像則屬于演藝型虛擬人?,F(xiàn)實生活中的明星可能會因為各種事情人設(shè)崩塌,給品牌造成不同程度的損失。演藝型虛擬人不存在人設(shè)崩塌的風(fēng)險。虛擬人另外一個顯而易見的優(yōu)勢是可以24小時在線營業(yè)。
2021年,百度推出了百度智能云曦靈數(shù)字人平臺,為各行各業(yè)提供虛擬主持人、虛擬員工、虛擬偶像、品牌代言人的創(chuàng)建與運營服務(wù)。目前,該平臺已生產(chǎn)20余位虛擬人。其中,央視AI手語主播、央視數(shù)字虛擬小編小C屬于演藝型虛擬人,浦發(fā)銀行虛擬人等屬于服務(wù)型虛擬人。百度智能云曦靈相關(guān)負責人對記者表示,演藝型虛擬人側(cè)重于通過內(nèi)容生產(chǎn)來幫客戶達成業(yè)務(wù)訴求,而服務(wù)型虛擬人則通過交互來滿足客戶訴求。該負責人稱:“目前,客戶對虛擬人的接受度及認可度較高,我們也在不斷打造新產(chǎn)品,降低技術(shù)門檻,讓虛擬人應(yīng)用到更多行業(yè)中。未來虛擬人還將與文旅、元宇宙空間等各類場景深度融合。”
據(jù)了解,現(xiàn)在不少從事虛擬人制作的技術(shù)公司前身是影視后期制作公司。王一寶告訴記者,目前市面上提供虛擬人服務(wù)的公司大多有自己的虛擬人儲備庫,他們的業(yè)務(wù)模式大致分為兩種:一種是客戶從已有的儲備庫里選擇適合自己品牌定位的虛擬人,直接買斷版權(quán);另一種是為客戶定制虛擬人形象,收取制作費以及后續(xù)的運營費用。由于定制標準不同以及制作公司的知名度不同,這兩種方式報價差別很大,從十幾萬元到上百萬元不等。
投入較大
技術(shù)成本占比高
目前,虛擬人發(fā)展尚處于早期,由于成本過高和功能不夠全面,超寫實風(fēng)格的虛擬人尚未得到大范圍使用。通常,做一個虛擬人要整合幾家公司來完成全鏈路。也就是說,虛擬人的人物設(shè)定、角色創(chuàng)建、角色動作、引擎驅(qū)動分布在不同的制作公司,各環(huán)節(jié)相對割裂。而更重要的是,制作智能程度高、互動性強的虛擬人的成本較高。一位虛擬人制作公司負責人向記者透露,制作一款具有AI驅(qū)動能力的虛擬人成本至少要上百萬元。其中,技術(shù)投入占到一半以上。張毅表示:“在如今商業(yè)化場景上,如果有一款虛擬人能夠持續(xù)地有內(nèi)容輸出,也許其帶來的收入能覆蓋成本。這才是一個行業(yè)可持續(xù)發(fā)展的方向。”
在頭豹研究院高級分析師朱曉雯看來,目前,虛擬人的人設(shè)打造、用戶培育和商業(yè)運營路徑主要有三種:第一是品牌、廣告營銷,比如AYAYI這種在小紅書、微博等渠道進行營銷、代言;第二是類似主播帶貨;第三是將虛擬人和游戲、影視等內(nèi)容相結(jié)合,如柳夜熙等。
值得注意的是,在虛擬人火爆“出圈”的背后,這一領(lǐng)域也存在一些爭議,比如道德倫理、商業(yè)化模式等。在張毅看來,虛擬人是科技進步、文化發(fā)展,以及商業(yè)社會變化的結(jié)果。隨著行業(yè)的發(fā)展,監(jiān)管部門、行業(yè)協(xié)會也會對虛擬空間制定一些行為規(guī)范。
人物篇
冬冬生成記
會說段子的“北京大妞”
“老規(guī)矩,想跟冬冬嘮嗑兒的朋友,在評論區(qū)互動起來!”直播間里,一個穿著白色連衣裙、梳著馬尾辮的女主播正忙著帶貨。她在介紹上架商品的間隙,還要回復(fù)評論區(qū)的提問、感謝“粉絲”的關(guān)注,甚至是替網(wǎng)友向工廠催貨。其間,她頻頻向網(wǎng)友賣慘:“打工人,打工魂。白天去央視做節(jié)目,晚上要來直播,空余時間還要踩縫紉機,我好辛苦。”
站在鏡頭前的主播叫冬冬,是一款A(yù)I實時驅(qū)動的虛擬人,是個地道的“北京大妞”。她會滑冰、會滑雪,還掌握好多的冰雪運動知識。正因如此,她在北京冬奧會期間成為了冬奧宣推官。
阿里巴巴達摩院是冬冬的研發(fā)機構(gòu),其相關(guān)負責人對記者表示,冬冬實現(xiàn)了AI實時驅(qū)動,其背后集合了數(shù)字人技術(shù)、計算機視覺、自然語言處理技術(shù)及語音技術(shù)等綜合能力的輸出。語言方面,冬冬可快速根據(jù)場景智能獲取并處理文本信息,生成邏輯通順、有一定文采的文本,內(nèi)容口語化、自然化、趣味化,更貼近自然人的語言。行為方面,她會通過文本或者語音輸入自動生成與之匹配的嘴型和面部動作。
通過AI技術(shù)驅(qū)動,冬冬可以表現(xiàn)得性格颯爽、風(fēng)趣幽默,還可以實時、有感情地和觀眾互動對話。她結(jié)合地域、性格等人物設(shè)定,通過AI算法與原型定位結(jié)合,生成了與真人近似度較高的人物造型。
“冬冬是我們的一個技術(shù)突破。整個冬奧會期間有28個虛擬人,如果一一去看,你會發(fā)現(xiàn)只有冬冬是不一樣的。她是第一個能夠和真人實時互動的虛擬人。不需要提前錄制,冬冬就可以與用戶對話。”該負責人表示,除了讓冬冬像真人一樣交流之外,他們團隊還賦予她一個有趣的“靈魂”。“冬冬是一個會說段子的虛擬人。我們希望她在人為設(shè)定的基礎(chǔ)上,還能表現(xiàn)得更加幽默。于是,我們找了一些脫口秀的模板,讓她去自動生成段子,最后效果很不錯。”
技術(shù)篇
從形似到神似
虛擬人的數(shù)字密碼
“好看的皮囊千篇一律,有趣的靈魂萬里挑一。”對于虛擬人來說,好看的皮囊與有趣的靈魂二者缺一不可。
從事虛擬人技術(shù)工作的李先生對記者透露,有一位投資人曾出資200多萬元做出了一款虛擬人,希望將她打造成一個IP,但沒過多久,這個虛擬人就銷聲匿跡了。在李先生看來,其失敗的原因主要是因為這款產(chǎn)品無法與人互動。“這種虛擬人只是基于真人的形象,然后換了一張好看的臉。盡管外觀非常接近真人,但她的作用僅限于錄些好看的視頻。”
艾媒咨詢披露的數(shù)據(jù)顯示:一半以上的網(wǎng)民表示喜歡虛擬人是出于其形象。“我并不排斥做IP,但我覺得這個IP要有靈魂,要可以和用戶交互,這樣才能讓用戶真正體會到虛擬人的價值。”李先生對記者表示,虛擬人要實現(xiàn)聲情并茂主要包括三個方面的技術(shù):生成、驅(qū)動、交互。通俗說來就是:外觀、語言、思想。
外觀方面,技術(shù)人員一般會通過建模來塑造虛擬人的表情和肢體動作,也會基于深度神經(jīng)網(wǎng)絡(luò)渲染技術(shù),采集真人的面容、肢體等數(shù)據(jù),渲染生成數(shù)字孿生人。為了使表情更加自然,虛擬人需要增加算法驅(qū)動。比如,一款虛擬人使用超過30TB的數(shù)據(jù)進行訓(xùn)練,可以呈現(xiàn)出超過72000個訓(xùn)練好的肌肉形狀,并做出全新的面部表情。
語言方面,是基于語音合成技術(shù)(TTS),將文本轉(zhuǎn)化為語音,結(jié)合自然語言處理能力,使虛擬人能夠像人類一樣理解、處理和生成語言。為了讓聲音更有“溫度”,技術(shù)人員往往會增加情感TTS技術(shù)。“如何讓人覺得這個虛擬人比較自然親切,這個技術(shù)是關(guān)鍵。”李先生說。
而思想,也就是交互能力方面,虛擬人通過語音語義識別等智能技術(shù)判斷用戶的意圖,從而決定后續(xù)的語音和動作。這就需要較高的多模態(tài)交互能力。模態(tài)用通俗的話來說就是感官。多模態(tài)交互需要通過文字、語音、視覺、動作、環(huán)境等多種方式進行人機交互。用戶與交互能力較高的虛擬人對話時,可以隨時打斷他說話也不影響后續(xù)的交流。
“憑借當前的AI技術(shù),有的虛擬人已不需要人工穿著動捕服驅(qū)動,就可以實現(xiàn)不受時間和空間的限制、24小時全天候工作。”百度數(shù)字人業(yè)務(wù)相關(guān)負責人對記者說道。
企業(yè)篇
玩家“組團”進場
入局占坑搶風(fēng)口
變現(xiàn),是大多商業(yè)行為的終極目標。但虛擬人行業(yè)距離玩家們定的目標似乎有點遙遠。“目前看來,這個領(lǐng)域的投入產(chǎn)出還不匹配。”上海想來想去文化傳媒有限公司總經(jīng)理王一寶告訴記者,虛擬人要保證IP吸引力就要不斷輸出優(yōu)質(zhì)的內(nèi)容,但后期每次發(fā)布虛擬人的圖片和視頻都是要產(chǎn)生費用的。要運營好一個虛擬人,一年至少需要上百萬元的成本。即使是一些高流量的虛擬偶像,可能仍處在燒錢吸粉階段。
“更多時候,虛擬人是一個引流的噱頭。公司指望她帶貨,銷售額連成本都覆蓋不了。”一位做女裝直播的主播告訴記者,她曾考慮讓虛擬人直播,但詢價后發(fā)現(xiàn)太貴,便作罷。
盡管目前虛擬人市場的盈利不及預(yù)期,但從國內(nèi)平臺虛擬主播的增長趨勢可以看出,這個賽道的“蛋糕”還是誘人的。企查查數(shù)據(jù)顯示,近5年相關(guān)企業(yè)注冊量呈整體上漲趨勢,2021年新注冊相關(guān)企業(yè)1000余家,同比增長63.69%。2022年一季度共新注冊近300家相關(guān)企業(yè),同比增長67.47%,其中已獲得融資的企業(yè)有11家。
“這是搭乘了元宇宙的順風(fēng)車。”王一寶認為,虛擬人是元宇宙場景中較好落地的一環(huán),因此形成了一個風(fēng)口。“現(xiàn)在虛擬人領(lǐng)域是一個短平快的打法。很多企業(yè)搶占市場,能找到融資就做,找不到就止損不做了。他們更多的是走資本運作的路線,這是目前這個行業(yè)的現(xiàn)狀。”王一寶說。
采訪中,多位業(yè)內(nèi)人士告訴記者,在目前虛擬人領(lǐng)域,中小體量的公司認真做產(chǎn)品的不多。一位從事影視后期制作的人士告訴記者:“賽道熱,有些沒有過硬技術(shù)的小公司也先入場占位。有的團隊恨不得拿張照片就去融資。大多數(shù)虛擬人制作公司沒有自己的‘造血功能’,靠投資續(xù)命。”
職場篇
虛擬人入職就業(yè)互補
“人機耦合”成趨勢
現(xiàn)在,虛擬人已經(jīng)不只是在跨年晚會和網(wǎng)絡(luò)平臺直播間里亮相了,越來越多的虛擬人從聚光燈前走進日常工作中。此前,萬科將“2021年度的優(yōu)秀新人獎”頒給了數(shù)字員工崔筱盼。這引發(fā)了一波熱議:被賦能的數(shù)字員工未來在職場上會不會取代人類,搶占了本屬于人類的就業(yè)崗位?
數(shù)字員工是一種高度擬人的新型工作人員,它是由人工智能、RPA(機器人流程自動化)、數(shù)據(jù)、機器人等多種技術(shù)深度融合而成?!度蛉斯ぶ悄苁袌?021預(yù)測》報告中指出:到2024年,預(yù)計45%的重復(fù)工作任務(wù)將通過使用由AI、機器人和RPA提供支持的數(shù)字員工完成。
“數(shù)字員工未來可能會做一些標準化程度較高、重復(fù)性較大的工作,例如銀行的柜員、客服,文旅中的博物館講解員、導(dǎo)游等。人將從標準化、重復(fù)性的勞動中解放出來,追求更加創(chuàng)造性的工作。”頭豹研究院高級分析師朱曉雯表示。
目前,虛擬人的行為背后需要一個團隊進行支援,因此,虛擬人入職在一定程度上屬于“就業(yè)互補”,而非“就業(yè)替代”。有業(yè)內(nèi)人士認為,虛擬人火爆的這幾年,可能還會催生一些新的就業(yè)崗位。
未來,“人機耦合”或成為用工市場的發(fā)展趨勢。過去大多是人對計算機進行指令操作。隨著人工智能技術(shù)的不斷發(fā)展,虛擬員工可能會成為人類的合作伙伴。(本報記者郝一萍寧廣靖)
關(guān)鍵詞: 元宇宙行業(yè) 虛擬人熱賽道 中國人工智能產(chǎn)業(yè) 計算平臺升級