昆侖萬維發布Matrix-Zero世界模型,開啟空間智能新時代
2025-02-14 19:15 互聯網
2月14日,昆侖萬維正式推出 Matrix-Zero世界模型,成為中國第一家同時推出3D場景生成和可交互視頻生成模型的探索空間智能的企業。

Matrix-Zero世界模型包含兩款子模型:
(1)昆侖萬維自研3D場景生成大模型,支持將用戶輸入的圖片轉化為可自由探索的真實合理的3D場景,比World Labs生成場景的探索范圍更大更自由,而且包括動態物理效果;
(2)昆侖萬維自研可交互視頻生成大模型,提供以用戶輸入為核心驅動的可交互空間智能視頻生成方案,支持根據用戶實時輸入生成互動視頻效果,具備更精準控制的action model。

昆侖萬維Matrix-Zero的3D場景生成功能,支持將用戶輸入的圖片轉化為可自由探索的真實合理的3D場景,具備全局一致性、可自由探索、支持不同風格圖片輸入、支持風格遷移、支持動態場景生成等亮點。
能夠實現這樣的逼真效果,得益于昆侖萬維自研3D場景生成大模型,包含兩個核心模塊:場景布局生成模塊和紋理生成模塊。幾何生成模塊借助可微渲染和擴散模型技術,能創造出和輸入圖片一致的3D場景布局;紋理生成模塊在圖片生成模型和視頻生成模型基礎上訓練,當用戶在場景中運動時,昆侖自研3D場景生成大模型不斷對場景缺失區域進行幾何和紋理的補全,從而確保用戶在任何位置、任何角度都能看到合理、一致的場景。
此前,谷歌Genie(可交互生成環境)系列已經向大眾展示了世界模型的能力和魅力。為達到更好的流暢性、一致性等,昆侖萬維可交互視頻大模型建立在先進的生成式視頻模型之上,結合自主研發的用戶交互模塊,最終實現了一種以用戶輸入為核心驅動的空間智能視頻生成方案。
該方法能夠在保證開放領域視頻生成能力的同時,進一步增強對視頻內容中視角移動的精確控制,使其更加符合用戶的交互需求和預期。通過這種方式,我們不僅可以生成符合用戶意圖的視頻內容,還能夠優化空間智能模型的適配性,從而拓展在虛擬環境、交互式應用以及沉浸式體驗中的應用場景。
作為針對圖片對應的 3D 世界中自由探索提出的視頻生成系統,Matrix-Zero 能夠在不同環境下高效地生成高質量的視頻內容,并確保視頻的流暢性、一致性和合理性。
緊握AI時代脈搏,成為中國探索空間智能的領跑者。昆侖萬維作為中國AI領軍企業,始終踐行公司使命——實現通用人工智能,讓每個人更好地塑造和表達自我,堅持在人工智能領域自主研發,持續推出AI產品。
過去三年,昆侖萬維在視覺多模態、深度學習、強化學習等關鍵技術方向取得了一系列成績,同時構建起了完整的AI矩陣:最懂金融、學術的天工AI搜索,全球首個AI音樂創作平臺Mureka,AI 短劇平臺SkyReels,AI社交產品Linky,AI游戲等,形成了“AI前沿基礎研究——基座模型——AI矩陣產品/應用”的產業鏈。
2025年1月,「天工大模型4.0」o1版和4o版正式上線天工APP和網頁。2025年2月8日,昆侖萬維旗下「天工AI」正式推出PC版重大更新——上線“DeepSeek R1 + 聯網搜索”功能。
勇立潮頭,敢為人先。今天,昆侖萬維Matrix-Zero系列模型的開發和迭代也代表了公司對未來AI技術的提前布局,進一步賦能公司AI業務矩陣。交互生成模型的落地將變革可交互內容引擎,大大提升公司AI多矩陣產品的生產力。
Matrix-Zero世界模型預計4月份上線,將對公司AI游戲生產、AI短劇生產和編輯等業務進一步賦能,為用戶和開發者帶來新的平臺和工具。當視頻模型發展到可以逼真模擬物理世界時,游戲可能不再需要傳統的3D引擎,許多實驗和模擬將可以在虛擬環境中進行,而影視創作也將變得更加普及,甚至成為每個人的基本技能。雖然這些看似是未來的場景,但技術正一步步將它們變為現實,視頻生成模型的火熱正是這一趨勢的重要體現。
未來大模型發展將更加關注智能體工具和用戶交互。空間智能技術不僅為未來智能體研發提供了虛擬平臺,也帶給用戶全新的與生成世界交互的體驗,大大提升了交互的多樣性。空間智能技術的發展也將是通往具身智能乃至AGI路上的一個重要技術里程碑。我們仍將持續升級迭代,研發更先進的AI平臺、打磨體驗更好的AI產品,進一步推動人工智能的繁榮發展。
廣告