成人美女黄网站免费|哔哩哔哩免费观看在线视频|freexx老女人|欧美精品三区|近的2019中文字幕在线|97中文字幕一区二区|日本jazz护士

巨人財經 - 專業科技行業財經媒體

全模態智能浪潮來襲:從Google Omni到Minimax,誰將引領下一個增長風口?

   發布時間:2026-05-21 00:27 作者:鄭浩

在今年的Google I/O大會上,Gemini Omni的發布成為全場焦點,引發了科技界對AI多模態能力的熱烈討論。這場大會的熱度較往年顯著提升,背后不僅是新技術的亮相,更寄托了業界對AI技術從模型能力向實際業務收入轉化的期待。谷歌此次推出的Omni,標志著其AI戰略從分散走向統一,試圖通過一個系統整合文本、圖像、視頻、音頻等多種模態的生成與理解能力。

Omni的核心突破在于其“全模態”架構。傳統AI工具往往專注于單一模態,例如文本生成或圖像處理,而Omni通過一個對話框即可完成寫文章、生成圖片、剪輯視頻、記住上下文等復雜任務。谷歌展示的案例中,用戶僅需輸入一句指令,系統便能自動生成一段完整的教學視頻,涵蓋空間關系、文字內容和推理邏輯三個維度。這種能力不僅限于“畫”出場景,更在于“理解”場景中各元素的物理關系和邏輯鏈條。

另一項關鍵創新是統一任務處理。此前,用戶完成一個帶字幕和背景音樂的短視頻制作,可能需要切換四五個工具,而Omni將文本、圖像、視頻、音頻等能力整合到一個系統中,大幅降低了操作門檻。谷歌的這一轉向,直接回應了市場對“全模態Agent”的迫切需求——真實世界的任務往往混合多種信息形態,只有具備跨模態處理能力的AI,才能真正跨越場景、適配角色。

谷歌的競爭對手們也在加速布局。OpenAI近期重組產品線,試圖融合“全模態實時交互”與“慢思考思維鏈”,但內部路線分歧導致進展緩慢。國內方面,Minimax成為少數在文本和多模態領域均領先的公司。其M2系列的Token用量在2026年2月較2025年12月增長6倍,每分鐘Token處理量(TPM)每周保持10%-20%的環比增速。摩根士丹利研報顯示,Minimax的ARR在2026年2月已超1.5億美元,年底有望達10億美元,單位經濟效益顯著優于行業平均水平。

Minimax的商業模式以效率為核心。其單臺8xH800推理服務器可實現每分鐘約1美元營收,運行成本不足0.3美元,毛利率從2024年的12.2%提升至2025年的25.4%,營銷費用同比下降40.3%。這種“低成本、高回報”的模式,源于其從創立初期便堅持的文本與多模態并行發展策略。與谷歌Omni類似,Minimax的底層能力在LLM預訓練、視覺模型、視頻生成等環節高度共享,研發投入的邊際效益隨模型迭代持續放大。

市場對“全模態”的期待正在轉化為實際收益。阿里財報顯示,其MaaS業務ARR已超80億元人民幣,預計2026年底達300億元,半年間增長3.75倍。這一增速部分依賴于其現有銷售網絡和云基礎設施,而純AI公司如Minimax的彈性空間可能更大。摩根大通指出,Minimax同時布局ToB和ToC市場,并通過全球化策略獲得經濟靈活性,其增長天花板顯著高于同行。

技術層面,Minimax的下一代模型M3和H3備受關注。M3預計將大幅提升AI Agent規劃、執行多步驟任務的能力,配合工程層創新(如MaxHermes),將應用范圍從代碼生成擴展至辦公場景。H3則有望在視頻理解能力上領先同行,并通過工程層設計降低使用門檻,使普通用戶也能輕松上手。瑞銀認為,Minimax的“模型+工程層”雙輪驅動模式,是其真正的護城河——模型是引擎,工程層是方向盤,二者結合才能實現高效落地。

全模態的普及正在重塑AI競爭格局。從ChatGPT的語言智能啟蒙,到Sora的視覺智能覺醒,再到Gemini Omni指向的全模態智能爆發,AI能力正從單一維度向復雜系統演進。當AI Agent能同時看懂設計草圖、聽懂語音指令、生成帶字幕的視頻并配上音樂時,其應用場景和商業價值將迎來指數級增長。這場變革中,誰能率先構建統一的多模態架構,誰便可能掌握下一代AI生態的核心生態位。

 
 
更多>同類內容
全站最新
熱門內容
本欄最新