值得買與中國人民大學高瓴人工智能學院聯合取得AIGC研究成果

2025-06-12 13:59 來源：證券日報網

本報訊（記者桂小筍）6月11日至6月15日，2025國際計算機視覺與模式識別會議（CVPR2025）召開。北京值得買科技股份有限公司（以下簡稱“值得買”）與中國人民大學高瓴人工智能學院在多模態領域的最新聯合研究成果《圖像轉有聲視頻》（《Animate and Sound an Image》）成功入選。

該成果首次提出了一種從靜態圖像直接生成同步音視頻內容的生成框架JointDiT（Joint Diffusion Transformer），實現了從圖像到“動態視頻+聲音”的高質量聯合生成。這不僅展現了雙方在AIGC領域的技術創新突破，也為AI多模態的高質量發展提供了新的思路與啟發。

據介紹，《圖像轉有聲視頻》首次提出并系統定義了圖像到有聲視頻生成（Image-to-Sounding-Video，I2SV）這一新任務：讓靜態圖像“動”起來的同時，生成與之語義匹配、時間同步的音頻內容。同時還提出了一種新穎的內容生成框架JointDiT（Joint Diffusion Transformer），并具體闡述了如何利用兩個強大的單模態預訓練擴散模型（一個視頻生成器，一個音頻生成器），構建統一的聯合生成框架，實現多模態協同生成。

人大高瓴人工智能學院長聘副教授宋睿華表示：“接下來，研究團隊計劃將JointDiT擴展至圖像、文本、音頻、視頻四模態的聯合建模，為構建更通用、更智能的多模態生成系統奠定基礎。”

（編輯何成浩郭之宸）

-證券日報網

熱點新聞

上半年港股IPO募資規模超千億港元 “A+H”陣營不斷壯大

下半年投資“風向標”出爐基金公司集體掘金科技與消費賽道

新公司法施行一周年：董責險規模擴張“保單價值”進階

積極向支付新規靠攏年內超30家支付機構“更新”牌照信息

24小時排行一周排行

深度策劃

5年后再啟航全面實施自貿區提升戰略

自貿試驗區作為我國對外開放的重要窗口……[詳情]

市場快訊

00:25	加碼新材料業務朗迪集團擬增持聚...
00:25	哈啰高調入局自動駕駛出租車賽道 ...
00:25	佳都科技籌劃赴港上市加快國際化...
00:25	直擊隆基綠能2024年年度股東大會：...
00:25	年內上汽集團單月銷量實現“六連漲...
00:25	諾力股份擬分拆中鼎智能赴港上市
00:25	上半年百強房企拿地總額同比增長超...
00:25	年內深圳樓市成交實現較高水平
00:25	AI醫療行業再迎利好相關概念股表...
00:25	風電設備退役潮悄然襲來資源化利...
00:20	上半年商業銀行管理層密集調整高...
00:20	今年以來數字人民幣生態持續優化

互聯網新聞信息服務許可證 10120240020增值電信業務經營許可證京B2-20250455

京公網安備 11010602201377號京ICP備19002521號

證券日報網所載文章、數據僅供參考，使用前務請仔細閱讀法律申明，風險自負。

證券日報社電話：010-83251700網站電話：010-83251800

網站傳真：010-83251801電子郵件：xmtzx@zqrb.net

午夜精品网站-午夜精品亚洲-午夜精品一区-午夜精品一区二区三区免费视频-欧美一区二区aa大片-欧美一区二区不卡视频

值得買與中國人民大學高瓴人工智能學院聯合取得AIGC研究成果