22/05/2026 11:33
【AI】智譜(02513)開放GLM-5.1高速版API予部分企業客戶
智譜(02513)宣布,面向部分企業客戶開放GLM-5.1高速版API,模型輸出速度達每秒400 tokens。
公司稱,實測數據顯示,高速版能力突出,代碼生成效率提升約10倍,可同步理解工程上下文並輸出方案;3D場景建模可實現文字輸入與場景即時聯動;還能即時生成匹配需求的工具與交互,具備新型作業系統雛形。而今次發布的高速版亦毋須為回應速度犧牲模型質量,可實現「即問即答」,改變傳統模型多輪調用耗時久的痛點。
該API由智譜GLM團隊與TileRT團隊聯合打造,經推理引擎、調度系統、基礎設施三層優化。其核心突破在於TileRT引擎,通過編譯期靜態編排與Tile級微任務調度,消除冗餘開銷,逼近硬件物理極限。目前,GLM-5.1高速版已適配AI編程、實時交互、商業決策、即時語音等高敏感場景,在智譜MaaS平台定向開放。
智譜稱,未來將持續優化推理引擎,擴大高速服務覆蓋,為企業提供低延遲、高智能的生產級AI能力,鞏固國產大模型在全球技術前沿的領先地位。
《經濟通通訊社22日專訊》
公司稱,實測數據顯示,高速版能力突出,代碼生成效率提升約10倍,可同步理解工程上下文並輸出方案;3D場景建模可實現文字輸入與場景即時聯動;還能即時生成匹配需求的工具與交互,具備新型作業系統雛形。而今次發布的高速版亦毋須為回應速度犧牲模型質量,可實現「即問即答」,改變傳統模型多輪調用耗時久的痛點。
該API由智譜GLM團隊與TileRT團隊聯合打造,經推理引擎、調度系統、基礎設施三層優化。其核心突破在於TileRT引擎,通過編譯期靜態編排與Tile級微任務調度,消除冗餘開銷,逼近硬件物理極限。目前,GLM-5.1高速版已適配AI編程、實時交互、商業決策、即時語音等高敏感場景,在智譜MaaS平台定向開放。
智譜稱,未來將持續優化推理引擎,擴大高速服務覆蓋,為企業提供低延遲、高智能的生產級AI能力,鞏固國產大模型在全球技術前沿的領先地位。
《經濟通通訊社22日專訊》
獨家優惠【etnet x 環球海產】用戶專享全場95折,特價貨品更可折上折。立即使用優惠代碼【ETN1WWS】,選購五星級酒店級海鮮► 立即瀏覽
-
上一篇
【AI】發改委:出台配套文件加快人工智能落地,加快建設具身智能訓練基礎設施 22/05/2026 11:34
-
下一篇
【AI】調查:約三分二美國投資者關注AI短期現泡沫,千禧世代對投資AI最有信心 21/05/2026 19:21
-
【AI】美團開源數字人視頻生成模型LongCat-Video-Avatar 1.5,生成10秒視頻僅需1分鐘 22/05/2026 15:25
-
【AI】DeepSeek推進100億美元融資,梁文鋒承諾續開發開源AI模型 22/05/2026 14:01
-
【AI】聯想(00992)料本財年AI相關收入錄高雙位數增長,若H200晶片獲批將利好內地市場增長 22/05/2026 13:01
-
【AI】SK中國聯席總裁到海蘭信考察,探討海底數據中心技術落地等 21/05/2026 17:39
-
【AI】騰訊會議推出「AI同傳」功能,時延低於3秒,發言與翻譯接近同步 21/05/2026 17:08