您的位置: 首頁(yè) > 推薦

視頻大模型 快手美圖殊途同歸

出處:北京商報 作者: 魏蔚 網(wǎng)編:王巍 2024-06-13

有圖像視頻業(yè)務(wù)傍身的互聯(lián)網(wǎng)企業(yè),加速奔向大模型。近日,快手正式上線(xiàn)視頻大模型“可靈”并開(kāi)始邀測,用戶(hù)輸入一段文字即可生成視頻。美圖宣布將在7月底上線(xiàn)新品MOKI,該產(chǎn)品基于美圖奇想大模型的視頻生成能力,可幫助用戶(hù)生成AI短片。不論是做視頻還是做短片,都是通過(guò)大模型輔助用戶(hù)創(chuàng )作,契合自己的主營(yíng)業(yè)務(wù)。目前,獲得內測資格的用戶(hù)可以免費使用可靈,其他AI功能以限時(shí)免費、限次免費等方式向用戶(hù)開(kāi)放。美圖相關(guān)人士并未透露KOMI的變現計劃,但付費會(huì )員、單次付費等變現模式已是美圖成熟的商業(yè)模式。

北京商報

不約而同

“今天你‘可靈’了嗎?”6月12日晚間,快手通過(guò)官方公眾號向用戶(hù)“安利”自家的視頻生成大模型“可靈”。為了證明實(shí)力,快手不光拿出一條由快手可靈生成的一分鐘預告片,還放出一系列首批獲得測試資格的創(chuàng )作者生成的視頻,如一朵花綻放的過(guò)程、復活成語(yǔ)故事《對牛彈琴》等。

打開(kāi)快手的視頻剪輯App快影,進(jìn)入主頁(yè)的“AI玩法”,再點(diǎn)擊“AI生成視頻”模塊填寫(xiě)問(wèn)卷,即可以申請免費的內測資格。根據內測網(wǎng)友提供的信息,用戶(hù)可以輸入一段200字以?xún)鹊奈淖置枋?,自行選擇超現實(shí)主義、極簡(jiǎn)等風(fēng)格,再等待約3分鐘,就能看到由可靈生成的一段5秒視頻。

來(lái)自快手的最新數據顯示,截至目前,在快影App上申請文生視頻內測資格的人數已超6萬(wàn),圖生視頻功能將于近期上線(xiàn)。

同樣瞄準視頻大模型出手的還有美圖。“目前市場(chǎng)上的AI視頻產(chǎn)品傾向于提供文生視頻等能力,我們認為只有深度理解創(chuàng )作者的需求,提煉有共性的視頻場(chǎng)景,才能打造輔助內容創(chuàng )作的工具。”美圖創(chuàng )始人吳欣鴻談到MOKI時(shí)說(shuō),“MOKI聚焦于A(yíng)I短片創(chuàng )作,專(zhuān)注于動(dòng)畫(huà)短片、網(wǎng)文短劇、故事繪本和MV等視頻場(chǎng)景。”

具體的工作流程是:在腳本、視覺(jué)風(fēng)格、角色等前期設定完成后,AI自動(dòng)生成分鏡圖并轉為視頻素材,通過(guò)智能剪輯、AI配樂(lè )、AI音效、自動(dòng)字幕等功能串聯(lián)素材并實(shí)現成片。MOKI的上述能力即基于美圖奇想大模型。

熱度升溫

除了快手、美圖,近日視頻生成的網(wǎng)紅應用Pika、聯(lián)合清華大學(xué)發(fā)布視頻大模型Vidu的生數科技,也為視頻大模型賽道添了一把柴。

Pika不久前通過(guò)官網(wǎng)宣布,Pika已完成總額8000萬(wàn)美元的B輪融資,由Spark Capital領(lǐng)投,Greycroft、Lightspeed Venture Partners以及Jared Leto參投。Pika團隊表示,這一輪融資將加快公司構建最佳視頻模型的進(jìn)程,同時(shí)幫助公司聘用優(yōu)秀的人才。

成立于2023年4月,爆火于2023年11月,早在Sora出世前,Pika就依靠AI生成和編輯3D動(dòng)畫(huà)、動(dòng)漫等多種風(fēng)格的視頻,成為網(wǎng)紅應用。

生數科技僅比Pika早成立一個(gè)月,主要業(yè)務(wù)集中在圖像、3D、視頻等原生多模態(tài)大模型的研發(fā)。2024年4月,生數科技聯(lián)合清華大學(xué)發(fā)布的視頻大模型Vidu,支持一鍵生成16秒、分辨率1080P的高清視頻內容。

6月初,生數科技宣布,已完成數億元Pre-A輪融資,由百度、北京市人工智能產(chǎn)業(yè)投資基金領(lǐng)投,此前這家創(chuàng )業(yè)公司還獲得了來(lái)自螞蟻集團、智譜AI等的投資。生數科技稱(chēng),將在本輪融資完成后堅持其原生通用多模態(tài)技術(shù)路線(xiàn),持續迭代優(yōu)化自研大模型,并加速產(chǎn)品開(kāi)發(fā)與市場(chǎng)拓展。

“近期視頻大模型活躍,說(shuō)明大模型最早形成的一些技術(shù)壁壘在被打破。”文淵智庫創(chuàng )始人王超告訴北京商報記者,“我認為能超過(guò)GPT-4的中國大模型可能在年中就會(huì )出現。中國的算力、能源和人才,支持著(zhù)中國大模型持續追趕。”

談及視頻大模型的門(mén)檻,中經(jīng)傳媒智庫專(zhuān)家張書(shū)樂(lè )向北京商報記者表示,“視頻生成不是將一堆AI繪畫(huà)連在一起變成動(dòng)畫(huà)片,除了考慮形象一致、符合描述、光影分割、分鏡表現等,還要具有對劇情的理解能力、再創(chuàng )造能力,這些都需要對視頻結構、內容解析等多個(gè)垂直領(lǐng)域進(jìn)行深度學(xué)習,難度高于聊天、繪畫(huà)或棋類(lèi)等靠主要數據堆積和用戶(hù)糾錯完成的功能”。

跟著(zhù)業(yè)務(wù)走

2022年底OpenAI的ChatGPT讓國內科技巨頭在生成式大模型賽道扎堆,且大多瞄準對話(huà)式互動(dòng)形式,2024年OpenAI又推出文生視頻模型Sora。和一擁而上的大語(yǔ)言模型競爭相比,在視頻大模型領(lǐng)域比拼的主角更多是圖像視頻類(lèi)互聯(lián)網(wǎng)公司。

站在技術(shù)的角度,王超認為,“這兩種大模型雖然都是AGI(通用人工智能),但技術(shù)路線(xiàn)不同,OpenAI兩個(gè)都做,但不是每個(gè)企業(yè)都有這樣的能力”。

在視頻大模型賽道,“快手和美圖的最大優(yōu)勢在于用戶(hù)積累、算法和數據處理等方面的經(jīng)驗”,深度科技研究院院長(cháng)張孝榮表示。

張書(shū)樂(lè )的看法是,“快手、美圖擁有可以讓人工智能深度學(xué)習的‘學(xué)習資料’,且可以規避一定的版權問(wèn)題。這兩家企業(yè)在視頻領(lǐng)域的內容積累、垂直細分的標簽標注,能讓大模型更好地‘檢索’知識”。

不過(guò)第三方觀(guān)察者也提醒,做視頻大模型的難度比大語(yǔ)言模型更高,前景還不明確,“這是沒(méi)多少?lài)鴥却竽P蛣?chuàng )業(yè)公司進(jìn)入視頻大模型賽道的原因,連巨頭都沒(méi)那么積極”,王超說(shuō)。“視頻大模型的變現比大語(yǔ)言模型困難。”張孝榮補充。

快手和美圖正通過(guò)各種手段吸引更多用戶(hù)使用AI,并尋找AI變現的路徑。以快影的AI創(chuàng )作功能為例,快影向用戶(hù)提供AI舞王、AI小說(shuō)轉漫畫(huà)、AI變裝、AI頭像壁紙等十幾種服務(wù),其中AI舞王提供免費5次的使用機會(huì )、AI變裝限時(shí)免費、AI小說(shuō)轉漫畫(huà)是VIP會(huì )員的權益。

美圖相關(guān)人士并未向北京商報記者透露MOKI可能的變現模式,但吳欣鴻在介紹美圖新品時(shí)多次提到產(chǎn)品的商業(yè)化數據,在他看來(lái),“如果AI幫用戶(hù)創(chuàng )收,用戶(hù)是很愿意為能創(chuàng )造價(jià)值的AI產(chǎn)品付費的”。

北京商報記者 魏蔚

右側廣告

本網(wǎng)站所有內容屬北京商報社有限公司,未經(jīng)許可不得轉載。 商報總機:010-64101978 媒體合作:010-64101871

商報地址:北京市朝陽(yáng)區和平里西街21號 郵編:100013 法律顧問(wèn):北京市中同律師事務(wù)所(010-82011988)

網(wǎng)上有害信息舉報  違法和不良信息舉報電話(huà):010-84276691 舉報郵箱:bjsb@bbtnews.com.cn

ICP備案編號:京ICP備08003726號-1  京公網(wǎng)安備11010502045556號  互聯(lián)網(wǎng)新聞信息服務(wù)許可證11120220001號