6月16日,AI獨角獸企業九章云極DataCanvas公司宣布,正式上線工業級強化學習AI新云平臺——九章強化學習云平臺AgentiCTRL。該平臺專為加速 AI智能體“訓推一體”而構建,通過強化“Control”能力,讓強化學習(RL)賦予大模型更強的行動力和決策控制力,助力全球領先企業和 AI 實驗室充分釋放創新潛力。
據實測數據顯示, AgentiCTRL將AI智能體訓推門檻壓縮至一行代碼。與傳統強化學習相比,該平臺端到端訓練效率提升500%,綜合成本下降60%,成為全球支持萬卡級異構算力調度的強化學習基礎設施。
九章云極DataCanvas公司是領先的AI基礎設施提供商,為企業和 AI 研究實驗室提供GPU 計算加速的AI云平臺、智算工具鏈及人工智能軟件等產品和服務。目前,該公司已在全球建立了多個針對加速計算進行優化的AIDC智算中心。
九章強化學習云AgentiCTRL是下一代智能體的智算基座
與數據驅動的深度學習不同,強化學習通過經驗迭代提升模型能力,突破了全球AI產業受限于靜態數據訓練的瓶頸,在智能體發展中展現卓越性能。
隨著DeepSeek、OpenAI等主流基座模型運用強化學習(RL)顯著提升推理能力,九章強化學習云平臺AgentiCTRL憑借基于反饋機制持續迭代的特性,正迅速崛起為下一代智能體的智算基座。
AgentiCTRL采用Serverless+RL混合架構,以低門檻、低TCO(總擁有成本)和高彈性等顯著優勢,成為推進AI普惠的基座。該平臺支持跨AIDC彈性資源調度,訓練高峰期可秒級擴展響應;實現萬卡級GPU集群的統一調度。同時,其多環境異構執行引擎支持CPU、GPU、NPU等多元算力透明調用,在AIDC一體化架構下,訓練任務可自動選擇優算力組合,這一優異表現使平臺在支撐萬億模型訓練時,仍保持毫秒級擴縮響應速度。
通過深度融合智能體訓練與推理的一體化,AgentiCTRL正在成為行業的智能體開發基座。在生物醫藥領域,AgentiCTRL平臺展現出卓越的技術優勢,依托對海量基因數據、蛋白質組數據的動態反饋優化機制,平臺可賦能智能體快速生成新型藥物分子結構,為靶向藥物研發、疑難病癥治療方案創新提供技術支撐。工業應用方面,平臺基于"數據提取+經驗反饋"的雙重特性,依托離散制造和壓力傳感等領域的經驗反饋數據,支撐智能體實現模型圖紙的實時生成能力。在游戲競技領域,經AgentiCTRL平臺訓練的模型已展現出超越職業玩家的競技水平。
一行代碼啟動的智算革命
在強化學習共識機制下,九章云極的工程化能力保障了AgentiCTRL的易用性、穩定性與快速迭代的能力。
九章強化學習云平臺AgentiCTRL核心突破在于徹底消解工業級強化學習的工程復雜度,支持開發者通過單行API調用平臺內DeepSeek、Qwen等國際主流模型,可調度跨AIDC的萬卡異構算力,其自動化多目標獎勵融合與Tool Use設計簡化訓推流程。
AgentiCTRL在訓推任務實測中表現卓越。和傳統強化學習方式相比,AgentiCTRL將Agent訓練耗時從13.8小時壓縮至8.7小時,訓練耗時縮短37%;GPU利用率從59%提升至84%,采樣軌跡延遲降低80%以上;獨創的“按度計費”模式實現綜合成本下降60%,突發訓練任務響應速度達秒級。
針對智能體后訓練的巨大市場需求,AgentiCTRL同步發布了業內訓練流程智能體Alaya-UI,實現一行代碼啟動強化學習訓練任務。九章云極DataCanvas公司技術副總裁楊健對此表示,“用戶無需準備算力、訓練環境或采樣環境——這些均由AgentiCTRL的智能體自動完成。”
Alaya-UI通過建模GUI環境為馬爾可夫決策過程,在OSWorld Task測試中任務完成率從6.87%躍升至24.8%,支撐"秒級生成百萬token級"的云編程需求,實現智能體訓推自動化任務。
面向生物醫藥、工業設計、消費創意等領域加速智能體進程,AgentiCTRL將憑借萬卡異構調度能力與秒級響應的可靠性,以低門檻、極具性價比的中國智算方案,支持大規模智能體應用創新,助力千行百業進入AI普惠時代。
