您所在的位置:首頁 > 新聞中心 > 行業(yè)動態(tài) > 正文
新聞中心
聯(lián)系我們

隨州市清華網(wǎng)絡科技有限公司
電 話:177-8671-3510
地 址:湖北省隨州市曾都區(qū)隨州市創(chuàng)新創(chuàng)業(yè)基地5樓(文峰佳苑C區(qū))

行業(yè)動態(tài)

中國人工智能視頻生成產(chǎn)品密集上線

作者: 來源:新華網(wǎng) 日期:2024/8/2 8:43:01 人氣:96

  新華社北京8月1日電(記者張漫子)在對話框中輸入一句話或添加一張照片,點擊“生成視頻”按鈕,不到一分鐘,一條6秒的短視頻立馬生成。“看,照片動起來了?!钡谝粨車L鮮國產(chǎn)視頻生成產(chǎn)品“清影”的“00后”用戶施司羽說。

  今年初,文生視頻大模型Sora在全球人工智能業(yè)內(nèi)外引發(fā)廣泛關注。近日,多個中國科技企業(yè)自主研發(fā)的視頻生成產(chǎn)品扎堆上線,引發(fā)關注。這意味著中國人工智能大模型的“應用試驗田”又多了一塊。

  生數(shù)科技今年4月聯(lián)合清華大學發(fā)布了視頻大模型Vidu,并于7月底正式上線。“此次Vidu正式上線,并全面開放了文生視頻、圖生視頻兩大功能,提供4s、8s兩種時長選擇,分辨率最高達1080P,將讓更多人感受文生視頻、圖生視頻的美好體驗?!鄙鷶?shù)科技聯(lián)合創(chuàng)始人兼首席執(zhí)行官唐家渝說。

  Vidu上線前數(shù)天,北京另一家人工智能公司智譜AI也上線了基于其大模型開發(fā)的視頻生成產(chǎn)品Ying(清影)?!扒逵安粌H支持文本生成視頻、圖片生成視頻,還支持視頻生成視頻?!敝亲VAI首席執(zhí)行官張鵬說。

  今年6月,快手發(fā)布的視頻生成大模型“可靈”,在文生視頻、圖生視頻方面展現(xiàn)出了創(chuàng)造逼真運動場景、精確模擬物理特性的能力與潛力。

  唐家渝和張鵬表示,當前中國視頻生成產(chǎn)品的主流技術路線,采用的是深度學習模型與擴散模型相結合的架構,遵從“規(guī)模定律”,強依賴算法、算力、數(shù)據(jù)。

  當前,全球范圍內(nèi)文本、圖片生成視頻模型賽道上已有多家科技企業(yè)參與競逐。除OpenAI的Sora之外,還有Runway的Gen系列、微軟的Nuwa、Meta的Emu、谷歌的Phenaki等。中國最早的入局者有生數(shù)科技的Vidu、智譜AI的清影、快手的可靈、商湯的日日新等。

  張鵬說,目前中國的視頻生成技術還處于起步階段,并不完美;接下來還有高質(zhì)量數(shù)據(jù)、算法等一系列問題有待逐一破解。然而加速人工智能技術發(fā)展的最好方式就是并行加速技術的研發(fā)與應用,而不是把技術關在實驗室里閉門造車。

  “從今天的技術實現(xiàn)角度,視頻大模型的迭代將顛覆影視動畫制作在內(nèi)的內(nèi)容產(chǎn)業(yè)?!碧萍矣孱A判,未來十年,影視創(chuàng)作生產(chǎn)的門檻與影視動畫制作的成本將進一步降低,更好地將想象力、創(chuàng)造力轉化為生產(chǎn)力。


    標簽:

    服務熱線:177-8671-3510 公司地址:湖北省隨州市隨州市創(chuàng)新創(chuàng)業(yè)基地5樓(文峰佳苑C區(qū)) 網(wǎng)站備案:鄂ICP備09003029號-2 公安備案:鄂公網(wǎng)安備 42130202000512號