快科技10月15日消息,據媒體報道,百度搜索近日宣布對文心助手進行全面升級,顯著增強其AIGC多模態創作與智能任務解決能力。
目前,該平台已支持AI圖片、視頻、音樂、播客等8種內容形態的生成,並支持用戶一鍵調用多種工具,應對生活、健康、教育、工作等多場景需求。
數據顯示,百度搜索用戶通過文心助手日均生成的AIGC內容量已突破千萬。與此同時,百度還發布了行業首個開放式實時互動數字人智能體,具備高逼真形象、低延時交互與情感識別能力,可提供專業內容與服務陪伴。
在內容創作方面,文心助手實現了從短內容到長視頻的全鏈路覆蓋。用戶輸入一段話,即可生成一部3分鐘的劇情短片,AI自動完成情節設計、角色塑造、場景搭建、鏡頭調度及配樂全過程。
此外,助手還集成「一句話寫歌」「MV製作」「名場面模仿秀」等創意功能,並提供超過30種特效模板。未來還將上線音樂數字人分身,進一步拓展創作邊界。
在視頻生成技術上,百度自研模型「蒸汽機」(文心專精)實現重大突破,率先在行業內支持AI長視頻的實時交互生成。該模型基於流式視頻技術,突破傳統AI視頻10秒左右的時長限制,實現「無限時長」生成,速度也領先於國內主流同類模型。
用戶只需上傳一張圖片並輸入提示詞,即可啟動生成流程,實時預覽推理畫面,並可在任意節點暫停或修改提示詞,實現對劇情、畫面與轉場的全程干預。這一能力標誌著AI視頻從「單向生成」邁入「雙向共創」階段,打造出真正意義上的「無限畫布」式創作體驗。
本次升級還同步推出了可交互數字人與開放世界動態構建兩大功能。數字人支持雙向沉浸互動,適用於AI導購、教育、陪伴等場景;開放世界則允許用戶在AI生成的地圖、景點甚至宇宙空間中自由探索,進一步拓展AIGC在虛實融合場景中的落地可能性。