Zhipu AIは、7440億パラメータのGLM-5モデルを発表した。同モデルは、デプロイコスト削減のためDeepSeek Sparse Attentionを特徴とし、複雑なエンジニアリングタスク向けに設計されている。API経由で利用可能なオープンソースモデルであり、主要AIモデルとの競争における戦略的な動きを示唆しており、産業用途での採用加速につながる可能性がある。
Zhipu AIによる、大規模パラメータ数とエージェントタスクに特化したアーキテクチャを持つGLM-5のリリースは、主要なオープンソースモデルとの競争における戦略的な動きを示唆している。コスト管理のためのDeepSeek Sparse Attentionの統合は、強力なAI導入の参入障壁を下げ、業界全体の複雑な産業・エンジニアリング用途での採用を加速させる可能性がある。
Zhipu AIが、複雑なエンジニアリング向け7440億パラメータモデル「GLM-5」をローンチ。
同モデルは、デプロイコスト削減のためDeepSeek Sparse Attentionを搭載。
GLM-5はオープンソースでAPI経由で提供され、高度な推論やエージェントタスクをターゲットとする。
GLM-5はオープンソースでAPI経由で提供され、高度な推論やエージェントタスクをターゲットとする。
事前学習データセットは28兆5000億トークンに拡張された。
Sign in to save notes on signals.
ログイン