文 | 陳首丞
編 | 石燦
8月10號(hào)的快手光合創(chuàng)作者大會(huì)上,高管圓桌環(huán)節(jié)開始前,一笑、于越、Thomas和笑古分別在視頻中做了自我介紹。
只不過,視頻中出現(xiàn)的并非真人,而是“一笑分笑”、“于越分越”、“Thomas分托”和“笑古分古”——快手高管們的數(shù)字人分身。
這些真假難辨的數(shù)字人,來自快手首次公開的AIGC數(shù)字人解決方案:快手智播,可以低成本創(chuàng)建數(shù)字人直播,制作數(shù)字人短視頻。用戶只需3-5分鐘的少量視頻素材,用時(shí)3天花費(fèi)千元,就可制成孿生數(shù)字人。目前,快手智播可在本地消費(fèi)、本地生活、電商直播等多種場(chǎng)景落地。
正如快手AI&用戶增長(zhǎng)業(yè)務(wù)負(fù)責(zé)人王仲遠(yuǎn)所說:身處這場(chǎng)AI技術(shù)變革之中,我們堅(jiān)信AIGC將賦予普通用戶更多的創(chuàng)作權(quán)力和自由,也堅(jiān)信AIGC將成為短視頻內(nèi)容生產(chǎn)的基礎(chǔ)設(shè)施。
數(shù)字人,用在哪?
在直播帶貨的達(dá)播領(lǐng)域,人貨場(chǎng)仍然是不可切分的緊密三角,數(shù)字人很難取真人而代之。但在非達(dá)播的場(chǎng)景,數(shù)字人有廣闊的應(yīng)用空間,且能大幅提升從業(yè)者的工作效率。
據(jù)了解,僅以快手為例,AI數(shù)字人在本地生活、本地消費(fèi)、24小時(shí)店播和海外商業(yè)素材生產(chǎn)等場(chǎng)景有廣泛的應(yīng)用,且曝光轉(zhuǎn)化率等核心指標(biāo)和大盤相比高達(dá)203%。
以快手的快聘業(yè)務(wù)為例,快手智播月均生產(chǎn)數(shù)字人素材上千條,以中低粉段達(dá)人拍攝視頻為基準(zhǔn)計(jì)算,單條短視頻創(chuàng)作成本降低到人工成本的5%以下。
顯然,同樣是招聘,在傳統(tǒng)的招聘平臺(tái)上發(fā)布文字信息的成本,要遠(yuǎn)遠(yuǎn)低于在短視頻平臺(tái)制作視頻的成本。在更早的時(shí)期,這一問題限制了招聘的短視頻化和本地生活化,讓有招聘需求的一方望而卻步。
但AI數(shù)字人的誕生和快手智播的存在,讓客戶可以像做PPT一樣做視頻和直播,僅需輸入文案,就可配置視頻,再通過快手的算法分發(fā)邏輯,將視頻推送給廣大有潛在需求的人群。這不僅利用了快手的用戶量和算法優(yōu)勢(shì),又將招聘方的成本降到了合理的程度。
據(jù)快手官方數(shù)據(jù),在低成本下,“全國操作工招聘”這一賬號(hào),在測(cè)試周所有主播中簡(jiǎn)歷投遞量能力排名第6,且這一賬號(hào)的招聘還突破了時(shí)間限制,在凌晨2-3點(diǎn)仍有拿單能力。
招聘之外,AI數(shù)字人在一些領(lǐng)域的表現(xiàn)也堪稱優(yōu)秀。比如本地生活,有服務(wù)商一次性投入五十個(gè)以上的賬號(hào)進(jìn)行開播,一個(gè)月內(nèi)有效總直播時(shí)長(zhǎng)達(dá)11640小時(shí),帶來了1.1萬個(gè)訂單和近百萬的GMV,轉(zhuǎn)化率是真人的兩倍,且成本還要更低。
其中,滬上吃喝玩樂花花系列賬號(hào)某快餐漢堡套餐單品一個(gè)月賣出近3000份;某游樂園全日門票單品一個(gè)月賣出30萬元,實(shí)際核銷率接近60%,近似真人直播效果。
至于直播帶貨的店播場(chǎng)景,在更早期的時(shí)間里,就有將24:00-6:00的時(shí)間段交給虛擬主播,用以保持直播間的24小時(shí)運(yùn)營和基礎(chǔ)商品介紹功能的案例。24小時(shí)的AI數(shù)字人直播間則是更加激進(jìn)的嘗試,這一方面是因?yàn)閿?shù)字人建模的能力在提升,達(dá)到了“真假難辨”的地步,另一方面也是因?yàn)榈瓴ケ旧淼奶厥鈱傩裕骸柏洝北取叭恕币匾?/p>
24小時(shí)店播的效果也不比真人要差,以美妝店鋪泉兮旗艦店為例,數(shù)字人測(cè)試直播半個(gè)月期間,人均觀看、3s播放率、轉(zhuǎn)化效率和商品訪問下單率均比該直播間真人主播表現(xiàn)更好,每場(chǎng)直播GMV貢獻(xiàn)近萬元。
花西子直播間也同樣使用了數(shù)字人主播,并對(duì)數(shù)字人的效果表示:“很多客戶提問交流,有可能我們效果太逼真,用戶沒看出是數(shù)字人,還是會(huì)問很多問題,我們也能迅速回復(fù)?!?/p>
以上的成功案例實(shí)際上都有共同點(diǎn),即“人”本身在場(chǎng)景中的引導(dǎo)能力,并非最重要不可替代的。對(duì)于招聘來說,展示出來的“招聘信息”是最重要的,用戶在進(jìn)行簡(jiǎn)歷投遞和工作選擇時(shí)仍要進(jìn)行二度篩選;本地生活和店鋪直播等等,“商品”的好壞和店鋪的履約能力是更重要的,“人”只起到引導(dǎo)和進(jìn)入的作用。
在這種情況下,AI數(shù)字人也就有了大展身手的空間。更低的成本和更好的效果,讓AI數(shù)字人更具競(jìng)爭(zhēng)力。
3分鐘,3天,千元成本 AIGC數(shù)字人的三個(gè)關(guān)鍵詞
數(shù)字人并非一個(gè)新鮮產(chǎn)物,在生成式AI進(jìn)入該領(lǐng)域之前,就已經(jīng)有一些數(shù)字人IP獲得了不小的成功。
2021年開始,與元宇宙概念相關(guān)的虛擬偶像率先出圈,如A-soul、柳夜熙和狐璃璃等,他們往往有大平臺(tái)扶持的背景,且都吸引了不小的聲量,其中,A-soul主要成員“嘉然今天吃什么”是B站百大UP主,柳夜熙在抖音擁有超800萬粉絲,狐璃璃在快手擁有超400萬粉絲,均是平臺(tái)頭部創(chuàng)作者。
不過,這批3D數(shù)字人IP,在商業(yè)化路徑上仍然走的是傳統(tǒng)流量經(jīng)濟(jì)的老路,收入來源以直播打賞或者廣告代言為主,這與其制作方成本的投入并不匹配。而且,“中之人”的存在,也讓這批數(shù)字人IP面臨一定的“塌房”風(fēng)險(xiǎn),難以成為真正的“數(shù)字”偶像。行業(yè)中也曾有過專為直播帶貨而生的IP,如遙望科技旗下的數(shù)字偶像“孔襄”,不過該數(shù)字人目前已經(jīng)停更,鮮有新動(dòng)向。
行業(yè)中更加廣泛存在的,則是數(shù)量龐大的2D數(shù)字人,在更早的時(shí)間段主要服務(wù)于政府、金融等行業(yè),C端用戶則無明顯感知。2023年開始,在生成式AI技術(shù)的加持下,有了爆發(fā)性的增長(zhǎng)。
一批公司也因此吃到了行業(yè)增長(zhǎng)的紅利,在抖音平臺(tái),虛擬人創(chuàng)業(yè)公司硅基智能已經(jīng)服務(wù)了上萬個(gè)客戶,主要聚集在本地生活和直播電商領(lǐng)域,也進(jìn)入了C輪融資階段,是數(shù)字人直播領(lǐng)域的頭部公司。
此外,行業(yè)內(nèi)還有定位SaaS版本視頻剪輯工具,專門服務(wù)于地方電視臺(tái),銀行,國家機(jī)關(guān)和地方政企的騰訊智影,以及主要給政務(wù),金融客戶提供定制化解決方案的百度靈犀和給短視頻賬號(hào)公司服務(wù)的閃剪等等。
除了定位于營銷場(chǎng)景的政企、傳媒、金融行業(yè)之外,短視頻和直播帶貨的數(shù)字人需求往往聚焦于垂類,比如短視頻中的口播場(chǎng)景以及直播帶貨中的標(biāo)品店播場(chǎng)景,這部分內(nèi)容對(duì)人的表現(xiàn)力需求不強(qiáng),因此能夠由數(shù)字人完美取代。
基于此,快手自研的AIGC數(shù)字人解決方案快手智播有著天然優(yōu)勢(shì),其與快手業(yè)務(wù)系統(tǒng)的深度打通,能更好的為快手生態(tài)服務(wù)。比如其完美匹配快手的直播系統(tǒng)和風(fēng)控系統(tǒng),還能自動(dòng)掛車和切換講解卡,同時(shí)回答觀眾的提問,和觀眾實(shí)時(shí)互動(dòng),這一過程又進(jìn)一步節(jié)省了人力的使用。
最低只需要3分鐘的視頻和音頻素材,用時(shí)3天,就可以制作相應(yīng)的數(shù)字孿生形象,同時(shí)快手還將提供整套的SaaS服務(wù)工具,不需要用戶另外采購任何硬件設(shè)備,只需輸入短視頻文案或者直播稿,就可一鍵生成視頻或開播。這套流程在當(dāng)前的技術(shù)能力下,僅需千元即可完成,而此前傳統(tǒng)數(shù)字人制作費(fèi)用一般需10萬元以上。
據(jù)快手技術(shù)人員介紹,為了達(dá)到目前的擬真度,快手基于自研高精度3D面部重建算法進(jìn)行了3D建模,還在數(shù)萬小時(shí)的模特?cái)?shù)據(jù)上進(jìn)行了訓(xùn)練,又針對(duì)每個(gè)具體模特進(jìn)行了微調(diào)。
而為了實(shí)現(xiàn)實(shí)時(shí)性,快手還有自研的推理引擎、部署框架、以及在多個(gè)業(yè)務(wù)中得以迭代的流式的數(shù)字人生成框架,能夠以秒級(jí)的低延遲實(shí)現(xiàn)數(shù)字人直播。
數(shù)字人背后,快手布局全模態(tài)大模型AIGC
實(shí)際上,數(shù)字人產(chǎn)品只是快手AIGC系列部署中的一環(huán),在光合大會(huì)上,王仲遠(yuǎn)強(qiáng)調(diào)了一個(gè)概念:全模態(tài)、大模型AIGC。
他表示:創(chuàng)作本身是一件需要?jiǎng)?chuàng)意和專業(yè)度的事情,持續(xù)創(chuàng)作優(yōu)質(zhì)作品會(huì)讓很多創(chuàng)作者感到壓力。以一個(gè)美食創(chuàng)作者為例,分享一道或十道拿手菜并不是難事,但長(zhǎng)期堅(jiān)持下去,總會(huì)在創(chuàng)意、素材和視頻制作等方面遇到難題。
而所謂的全模態(tài)、大模型AIGC解決方案,就是為了解決創(chuàng)作者在創(chuàng)作過程中的各種痛點(diǎn)而生。據(jù)王仲遠(yuǎn)介紹,這套方案可以幫助創(chuàng)作者更好的激發(fā)創(chuàng)意,用戶只需一個(gè)指令,就可以讓大模型幫助自己完成故事撰寫、腳本整理,并能夠基于場(chǎng)景主題生成對(duì)應(yīng)的圖片和配樂。用戶不用再絞盡腦汁反復(fù)腦暴,可以讓大模型提供更多的靈感和創(chuàng)意。
在大會(huì)上,王仲遠(yuǎn)還展示了大模型的素材繪制功能,針對(duì)周杰倫創(chuàng)作的歌曲《七里香》,大模型自動(dòng)畫出了相關(guān)畫面,這也就意味著,創(chuàng)作者在使用快手大模型的時(shí)候,可以自由地提供場(chǎng)景描述來獲得素材,最終簡(jiǎn)化創(chuàng)作視頻的流程。在電商場(chǎng)景上,大模型也可以幫助B端創(chuàng)作者將所售商品進(jìn)行3D化展示,進(jìn)一步提升消費(fèi)體驗(yàn)。
甚至,傳統(tǒng)視頻直播中費(fèi)時(shí)費(fèi)力門檻頗高的剪輯工作,也可以由快手大模型的AIGC解決方案取代。創(chuàng)作者只要自行上傳相關(guān)素材,就可以得到相應(yīng)的短視頻內(nèi)容。
此前,不少大模型產(chǎn)品都是針對(duì)某項(xiàng)具體的場(chǎng)景應(yīng)用,譬如對(duì)話提供相應(yīng)的文字解決方案或者AI智能生成圖片。而快手的全模態(tài)、大模型AIGC,不只定位于個(gè)別功能,而是聚焦于用戶在快手的各種需求,讓用戶在創(chuàng)作視頻和帶貨的每一步都能得到AI的幫助。
而這,顯然更符合AI誕生的本意,AI出現(xiàn),不是為了取代誰的工作,而是幫助人類把工作變得更簡(jiǎn)單。全模態(tài)AIGC如此,快手智播這一產(chǎn)品更是如此。在以人為核心,以創(chuàng)作者為核心的基本價(jià)值觀下,相信每一個(gè)快手的創(chuàng)作者,都可以用好AI,在快手獲得更好的創(chuàng)作體驗(yàn)。
分享到: