11月18日消息,今日,螞蟻集團正式發布全模態通用AI助手「靈光」,開創性地在移動端實現「自然語言30秒生成小應用」,並且可編輯可交互可分享。
同時,靈光也是業內首個全代碼生成多模態內容的AI助手。
靈光首批上線三大功能——「靈光對話」、「靈光閃應用」、「靈光開眼」,支持3D、音視頻、圖表、動畫、地圖等全模態信息輸出,對話更生動,交流更高效。
目前,靈光已同步登陸安卓與蘋果應用商店。
據介紹,「靈光對話」可通過結構化思維,讓AI回答邏輯清晰、表達簡練;通過生成可視化內容,如動態3D模型、可交互地圖、音視頻等,在內容呈現上更靈活。
在教育場景下,用戶諮詢靈光知識性問題,靈光能夠洞察並提煉知識點,有邏輯有層次地展示,並能生成3D實物動圖、可互動的示意表格等。
這種可秒級生成、又極簡多元的可互動回答,背後是靈光實現了基於全代碼生成的多模態輸出能力。
所有呈現的結果,包括圖表、動畫,小應用等組件,都是由模型根據對話情境即時生成並呈現給用戶。
同時,靈光構建了多智能體協作的Agentic架構,能夠動態調度圖像、3D、動畫等專用Agent與工具,實時協作,為用戶提供更完整、更豐富、更沉浸的視圖體驗。
值得一提的是,靈光開創性地面向普通用戶推出了「閃應用」功能。
用戶在對話中說出或輸入一句話,靈光1分鐘以內、最快30秒就能生成一款AI應用。
如用戶諮詢「溏心蛋要煮多久?」靈光可生成一個「溏心蛋時間計算器,用戶根據實際情況自己選擇「雞蛋大小」「要求的熟度」等條件,自己調整出一個最符合自己情況的答案。
用戶想知道怎樣養車最划算,靈光可以生成一個「養車成本計算器」,用戶自由選擇里程、油費等,組合出極具個性化的養車方案。
此外,靈光生成的閃應用不只是靜態前端頁面,而是可以直接調用大模型等後端能力,讓應用不僅能展示結果,更能實時與外部進行交互,顯著拓寬可實現的場景邊界。
作為一款全模態通用AI助手,「靈光開眼」功能搭載了AGI相機技術,通過實時視頻流解析實現對物理世界的觀察和理解,並支持文生圖/視頻、圖生圖/視頻等多種創作模式。
比如,在旅遊場景下,用戶用靈光對準想了解的建築,靈光可以實時「看見」並講解。
靈光作為螞蟻集團AGI戰略的產品級探索,其核心理念「讓複雜變簡單」,通過將應用開發嵌入日常對話,重新定義了通用型AI助手的生產力邊界。
螞蟻集團2025年以來加速AGI布局,已發布AI醫療管家AQ、布局具身智能靈波科技,螞蟻百靈大模型也躋身了萬億參數模型陣營。
靈光的推出,進一步展現了螞蟻在通用人工智慧領域從技術突破到場景落地的全鏈路能力。