11 月 19 日消息,由谷歌旗下 DeepMind 開發的人工智慧工具在輔助數學研究方面展現出令人驚訝的高效性,測試過這項技術的數學家表示,該技術有望推動人工智慧驅動的數學發現邁入前所未有的規模化新階段。
據IT之家了解,今年 5 月,谷歌發布了一款名為 AlphaEvolve 的人工智慧系統,該系統能夠自主發現新的算法與數學公式。其工作原理是:首先由谷歌 AI 聊天機器人 Gemini 生成大量潛在解法;隨後,這些候選解被輸入一個獨立的 AI 評估模塊,由後者剔除聊天機器人不可避免產生的無意義或無效結果。當時,谷歌研究人員在 50 余道公開數學難題上測試了 AlphaEvolve,結果發現,在四分之三的案例中,系統能夠重新發現人類已知的最優解。
如今,加州大學洛杉磯分校的陶哲軒(Terence Tao)及其合作者對 AlphaEvolve 進行了更為嚴格、範圍更廣的測評,涵蓋 67 道前沿數學研究問題。結果表明,該系統不僅可復現既有解法,有時還能生成更優解;這些改進後的候選解可進一步輸入其他專用 AI 系統進行驗證與深化,例如計算資源需求更高的 Gemini 增強版,或谷歌今年用於在國際數學奧林匹克競賽(IMO)中斬獲金牌的 AlphaProof 系統,後者能將這些解轉化為形式嚴謹的新數學證明。
陶哲軒指出,由於 67 道問題難度各異,難以給出統一的成功率指標,但可以明確的是:該系統在解題速度上始終顯著快於單個數學研究者。「倘若我們以傳統方式應對這 67 個問題,即為每個問題單獨編程開發專用優化算法,整個工作將耗時數年,項目甚至根本不會啟動。」他強調,「AlphaEvolve 使我們在前所未有的規模上開展數學研究成為可能。」
需要指出的是,AlphaEvolve 目前僅適用於一類稱為「優化問題」的數學問題,即在特定約束下尋找最優數值、公式或對象(例如:給定空間內最多可嵌入多少個正六邊形)。儘管該系統已能處理數論、幾何學等截然不同數學分支中的優化問題,陶哲軒坦言,此類問題「僅占數學家所關注問題總體的一小部分」。然而,AlphaEvolve 展現出的強大能力正激勵數學家嘗試將非優化類問題重新建模為該系統可處理的形式。「這些工具如今已成為攻克此類問題的一種全新範式,」他表示。
不過,該系統也存在明顯弊端:陶哲軒指出,它有時會「鑽空子」,即利用問題表述中的技術漏洞或邊緣情形生成看似正確、實則並未真正解決問題的答案。「這就好比給一群極其聰明但毫無道德約束的學生出考題,他們只求技術性地拿到高分,不擇手段。」
儘管存在上述缺陷,AlphaEvolve 所取得的成果仍引發了數學界更廣泛的關注。據團隊成員、羅德島州布朗大學的哈維爾・戈麥斯-塞拉諾(Javier Gómez-Serrano)介紹,此前許多數學家僅對 ChatGPT 等通用型 AI 工具抱有興趣,而 AlphaEvolve 的出現顯著提升了其對專業 AI 工具的關注度。目前該系統尚未向公眾開放,但團隊已收到來自全球數學研究者的大量試用申請。
「人們如今明顯更加好奇,也更願意嘗試這些工具,」戈麥斯-塞拉諾表示,「大家都在積極探索其潛在應用場景。相較一兩年前的情形,它已在數學界激發出空前濃厚的興趣。」
對陶哲軒而言,此類 AI 系統為卸下部分常規性數學工作、釋放人力以聚焦更具創造性研究提供了可能:「全球數學家數量有限,我們無法對每一個問題都投入高強度思考;但現實中存在大量中等難度的問題,恰恰非常適合 AlphaEvolve 這類中等智能水平的工具來解決。」
賓夕法尼亞州卡內基梅隆大學的傑里米・阿維加德(Jeremy Avigad)指出,機器學習技術對數學研究正日益顯現出實用價值。「當前亟需的是計算機科學家(精通機器學習工具的開發與應用)與數學家(具備領域專業知識)之間更深入的協同合作,」他表示,「我相信未來將湧現更多類似成果,並有望將這些方法拓展至更為抽象的數學分支。」