新加坡國家 AI 計劃放棄 Meta 模型,轉向阿里千問

神马作文网 教育资讯 11

11 月 25 日消息,阿里巴巴集團旗下的阿里雲於 11 月 24 日宣布,將為新加坡國家人工智慧計劃(AI Singapore,簡稱 AISG)最新版本的「Sea-Lion」大語言模型(LLM)—— 即 Qwen-Sea-Lion-v4 提供技術支持。值得一提的是,AISG 此次是放棄了 Meta 模型,轉向阿里巴巴的通義千問 Qwen 開源架構。

阿里雲在新聞稿中指出,該最新版本基於阿里雲的 Qwen3-32B 基礎模型構建,其發布標誌著 AISG 在推動區域範圍內更強大、更普惠的人工智慧解決方案方面邁出了「重要一步」。

此外,雙方合作還包括阿里云為該大模型的「高級後訓練階段」提供技術支撐。阿里雲強調,基礎模型 Qwen3-32B 已額外接受了超過 1000 億個東南亞語種詞元(tokens)的訓練,從而顯著提升了其對本地表達方式、對話細微差別及區域性知識領域的理解能力。

作為 Qwen 系列的最新一代,Qwen3 基礎模型本身已在規模龐大、高度多元的數據集上完成預訓練,涵蓋 119 種語言與方言,總訓練數據量達 36 萬億詞元。這使其從初始階段即具備更廣泛的語種覆蓋能力,尤其強化了對主流人工智慧模型中通常代表性不足的東南亞語言的支持。

作為合作的另一關鍵環節,AI Singapore 貢獻了其開源的區域性數據集 —— 包括面向東南亞語言任務的數據整理、優化與評估工作。

目前,Qwen-Sea-Lion-v4 在參數規模低於 2000 億的開源大模型中,位居「東南亞語言模型綜合評估排行榜」(South-east Asian Holistic Evaluation of Language Models)首位。該模型已在 AI Singapore 官網及 Hugging Face 平台開放免費下載。

值得一提的是,2023 年 12 月,新加坡正式啟動一項總額 7000 萬新元(IT之家註:現匯率約合 3.81 億元人民幣)的國家級計劃,旨在全面提升本國在多模態大語言模型領域的科研與工程能力。該項目由新加坡國家研究基金會(NRF)提供資金支持,並獲資訊通信媒體發展局(IMDA)背書。


抱歉,评论功能暂时关闭!