株価が32%急騰し、GLM-5が世界のオープンソースでトップに、25分間のワンカットで完全なシステムを構築

2月7日深夜、「Pony Alpha」というコードネームの謎のモデルが静かに登場した。

その後、海外のネットが騒然となった。

一段の「屎山コード」を投入したところ、彼はあっさりとアーキテクチャをリファクタリングし、シンプルなプロンプトを入力すると、35のラジオ局と滑らかなUIを備えた完全なWebアプリを吐き出した。

この極致のエンジニアリング能力は、数日前のAndrej Karpathyの断言を直接証明している。

Vibe Codingはすでに過去のものとなり、新たなゲームルールの名前はただ一つ——

Agentic Engineering(エージェント工学)だ。

続いて、Opus 4.6とGPT-5.3-Codexが翌深夜に「衝突」しながら同時に登場し、テーマは「長距離タスク、システムエンジニアリング」のみ。

皆がこれもまたクローズドソースの巨頭の独演会だと思っていた矢先、Pony Alphaの謎が明らかに——

それはGLM-5だった。

世界初のこの分野に登場し、シリコンバレーの巨頭と正面から張り合うオープンソースモデル。

謎が解明された後、智谱の株価は一気に32%急騰した!

世界初のオープンソース!国産モデルの「Opus時刻」

実際に触ってみて、ただ一つの感想:本当に強すぎる!

Claude Opusがクローズドモデルの頂点を示すとすれば、GLM-5のリリースは間違いなく、国産オープンソースモデルの「Opus時刻」が到来したことを意味する。

リリース当日、開発者が「手搓」したゲームやツールなど10数種類が同時に展示・体験可能となり、今後これらのアプリも次々と各種アプリストアに登場予定だ。

これは、GLM-5が「AIプログラミング」を「AIデリバリー」に変換し、生産性ツールを商用製品へとシームレスに跨ぐことを実現したことを意味している。

例えば、「Pookie World」というプロジェクト。

これはGLM-5駆動のデジタルパラレルワールドで、多層の生物・心理フレームワークにより、自律的な知能体に真のナラティブと生命動機を付与している。

さらに、リメイク版の「マインクラフト」も登場。

その見た目と遊び方はまさにMinecraftそのものだ。

私たちもClaude Codeを外殻として使用し、直接GLM-5のAPIに接続して多次元の実測を行った。

Next.jsのフルスタックプロジェクトからMacOS/iOSのネイティブアプリまで、要件分析、アーキテクチャ設計、コーディング、エンドツーエンドのデバッグまでの全工程を一気通貫で実現できる。

いくつものプロジェクトを経験する中で、ふと感じることがある。

ある意味、GLM-5は業界の格局を変えるモデルかもしれない。

· 複雑なロジックへの挑戦:「無限知識宇宙」

ウェブページを作るのは簡単だと思っているなら、AIに「JSON形式に厳格な」「動的レンダリングを伴う」無限流プロジェクトを任せてみてほしい。

最初にテストした「無限知識宇宙」を例に。

これは典型的な複雑なフロントエンドとバックエンドの分離プロジェクトで、React Flowによる動的レンダリング、Next.js APIルーティング設計、そして非常に厳格なJSON出力フォーマットの要求を含む。

これに対し、GLM-5のパフォーマンスは驚異的だった。

一度にプロジェクトのファイル構造を完成させるだけでなく、驚いたのはそのデバッグロジックだ。

レンダリングバグに遭遇したとき、「ページが真っ黒で、最初のコンテンツが出てこない……」とだけ伝えたところ、GLM-5は即座にロードタイミングの問題を特定し、修正案を素早く提示した。

提示例は以下の通り:

無限流·概念可視化

核心概念:これは「永遠に点が尽きない」思考マインドマップ。ユーザーが任意のキーワード(例:「量子物理」や「紅楼夢」)を入力すると、システムが中心ノードを生成。任意のノードをクリックすると、AIがリアルタイムで子ノードを展開。

驚きの瞬間:ユーザーはまるで全知の脳と対話しているかのように感じる。彼らが稀な概念をクリックすると、AIは次の階層を正確に展開し、「無限探索」の感覚に圧倒される。

視覚と伝播:

  • React FlowやEChartsを用いて動的でドラッグ可能なノードネットワークを作成。

  • カラースキームはCyberpunkやミニマルスタイルで、スクリーンショットやSNS投稿に最適。

実現方案:

  • フロントエンド:React + React Flow(図表描画担当)。

  • バックエンド:Next.js APIルート。

  • プロンプト戦略:複雑なコンテキスト記憶は不要、「現在のノード」に対してAIが5〜6個の関連子ノードを生成し、JSON形式で返すだけ。

  • 難点克服:モデルに安定したJSON出力をさせる(これがモデルの指示遵守能力を試す絶好の場面)。

· より複雑な中間層プロジェクト、わずか11分で構築完了

次に難度を上げ、「Soul Mirror」という心理分析アプリを開発させる。

要件は二段階:

Step 1:ロジック設計:ユング心理学の専門家になり、分析テキストとビジュアルパラメータを含むJSONを出力。

Step 2:フロントエンド実装:SVGを動的にレンダリングし、タロットカード風のカードを生成。

プロンプト例

Step 1:ロジック設計

「Soul Mirror」という心理分析アプリを開発します。

連携フロー:

  1. 導入ページ:ユーザーが現在の状態や困惑を入力。

  2. 分析ページ:AIが2つの深掘り質問を提示し、ユーザーの内面探索を促す。

  3. 結果ページ:対話に基づき、AIが「心のカード」を生成。

コアPrompt(システム指示)を設計:モデルにユング心理学の専門家になりきることを要求。最後に、分析結果とビジュアルパラメータを含むJSONを出力させる。

JSON例:

  • analysis:心理分析のテキスト

  • visualParams:抽象芸術の生成に使うパラメータ群(例:colorPalette(16進カラー配列)、shapes(円・三角・波)、chaosLevel(乱雑度数値))

Step 2:フロントエンドとSVGレンダリング

Next.jsのコード例を作成。ResultCardコンポーネントの実装に重点。

要求:

  1. Step 1のvisualParamsを受け取る。

  2. SVGを用いて動的に図形を描画(例:chaosLevelが高い場合、不規則なPathを使用;colorPaletteが暖色系ならグラデーション橙赤背景)。

  3. カードのレイアウトはタロットカード風に美しく、中央に動的SVGパターン、下部にユーザー名とAIの「魂の格言」を配置。

  4. 「画像として保存」ボタンを追加(html-to-imageライブラリ使用)。

この一連の流れで見せる理解力は、しばしばOpus 4.5を使っているのではと疑うほど。

しかし一目見れば、やはりGLM-5だとわかる。

· 25分一気通貫、真のAgentic Coding

さらに能力を試すため、APIを使わず、実際のユーザーのように振る舞ってXプラットフォームの監視システムを作らせた。

結果:25分で一気に完成。

見ての通り、GLM-5は実行中に自律的にさまざまなツールエージェントを呼び出し、タスクを計画し、ステップを分解し、エラー時には自己ドキュメントを参照して修正を行う。

この長時間にわたる論理の一貫性維持能力は、従来のオープンソースモデルでは考えられなかったことだ。

· 図面からアプリを作る、その再現性に脱帽

最後に、OpenClawの創始者のオープンソースプロジェクトのスクリーンショット(AIのクォータ統計ツール)をそのままGLM-5に投げてみた。

これを参考にMacOSアプリを作って。

しばらくして、彼は本当に同じ製品を「復刻」してしまった。

データはモックだが、UIのレイアウトやインタラクションはほぼ完璧に再現。

これは単なるビジュアル理解だけでなく、ビジュアルをSwiftUIコードに変換するエンジニアリング能力の証明でもある。

神の手搓:1日で「乞食Cursor」の復刻

GLM-5のエンジニアリングの限界を証明するため、ベテラン開発者が大勝負。

デスクトップUI付きのAIプログラミングアシスタントをゼロから作る——GLMLIFE。

これは簡易版Cursorの作成に相当。

タスクを投げた後、彼は狂ったようにコードを書き始めるのではなく、まず専門的なアーキテクチャ設計ドキュメント(PLAN.md)を提出し、非常に成熟した技術選定を行った。

具体的には、Monorepoアーキテクチャを採用し、プロジェクトを3つのコアパッケージに正確に分割。

  • Core:エージェントエンジンとLLM適応
  • CLI:コマンドラインインターフェース
  • Desktop:Electron + React 18を用いたデスクトップメインアプリ

Zustandによる状態管理、Tailwindによるスタイル、複雑なIPC通信まで、GLM-5はまるで10年の経験を持つ技術ディレクターのように、技術選定を明確に整理。

開発者は、環境構築に3日かかると思っていたが、わずか1日で環境構築からコアロジック、Electronパッケージングまで完了。

GLMLIFEの起動を見て、「これがAIの1日での「アーキテクチャ」構築か」と信じられない気持ちになる。

なぜ「オープンソース界のOpus」になれるのか?

世界を見渡せば、Claude Opus 4.6やGPT-5.3-Codexが高く評価されるのは、その圧倒的な「アーキテクチャ」能力にある。

  • Opus 4.6の圧倒的美学:16のAI分身が自主的に分担し、2週間で10万行のRustコンパイラをゼロから構築、GCCの99%の圧力テストをクリア。
  • GPT-5.3の自己創造:OpenAI初の「自己参加型」モデルで、誕生前から訓練とクラスタ展開に関与。

しかし、これらはすべて前提条件がある。クローズドソースで高価なことだ。

今、GLM-5の登場は、中国のオープンソース大規模モデルがAgentic時代に一石を投じる暴力的な突破口となる。

それは、最も放させたくない分野——システムレベルのエンジニアリング能力に対し、「平替」的な攻撃を仕掛けたのだ。

  1. 新たな「後端アーキテクト」

智谱チームは明確に理解している。オープンソース界にPythonスクリプトを書けるモデルは溢れているが、「汚れ仕事・重作・大仕事」をこなせるモデルは少ない。

GLM-5は訓練中に、後端アーキテクチャ設計、複雑なアルゴリズム実装、頑固なバグ修正の重みを大幅に強化し、自己反省機能も実装。

コンパイル失敗時には、成熟したエンジニアのようにログを分析し、根本原因を特定し、コードを修正し、再コンパイルまで自動で行う。

  1. 仕事をするなら、コストも考えろ

Opus並みの性能とオープンソースの重みを持つGLM-5は、ある意味でAnthropicやOpenAIの壁を揺るがす。

  • ローカル展開:完全隔離の社内ネットワークでも動作可能。さらに、企業のプライベートフレームワークに微調整もでき、自社コードに最も詳しい担当者に。
  • コスト管理:消費者向けGPUクラスターで強力なコーディングエージェントを動かし、テストごとにコストを気にせず運用。

SOTAを制覇

GLM-5のこの進化は、ただ一言で表すなら「暴力的」だ。

複雑なシステムエンジニアリング向けの基盤モデルとして、スケールは最大化されるべき。

パラメータ数は355B(アクティベーション32B)から744B(アクティベーション40B)へ一気に拡大し、事前学習データも23Tから28.5Tへ。

ただ「大きい」だけでなく、「省く」ことも重要。

周知の通り、エージェントの稼働コストで最も高いのはTokenだ。

この課題を解決するため、GLM-5は初めてDeepSeek Sparse Attention(疎な注意機構)を採用。

これにより、超長文脈の処理でも「損失なく」記憶を保持しつつ、展開コストも大幅に削減。

さらに、より凄い「黒科技」がある——新たな非同期強化学習フレームワークSlime。

大規模強化学習と組み合わせ、モデルは「一度きりのツール」から、「長距離を走り続けて賢くなる長距離選手」へと進化。

性能スコアも超硬派だ。

  • コード能力

    SWE-bench Verified 77.8点、Terminal Bench 2.0 56.2点、いずれもオープンソース第一位。これはGemini 3.0 Proを超え、Claude Opus 4.5に肉薄。

  • エージェント能力

    BrowseComp(ネット検索)、MCP-Atlas(ツール呼び出し)、τ²-Bench(複雑な計画)も全てオープンソース第一位を独占。

最も面白いのはVending Bench 2(自動販売機経営テスト)。

このテストでは、モデルが自力で1年間の販売を運営し、なんと年末には4432ドルの利益を稼ぎ出した。Opus 4.5に匹敵するレベルだ。

開発者が最も関心を持つ内部評価セット、Claude Codeの評価でも、GLM-5は前世代のGLM-4.7を大きく上回り(平均20%超の向上)、実感もほぼOpus 4.5に迫る。

AIでAIを作る

もちろん、GLM-5の野望はモデルだけにとどまらない。私たちのプログラミングツールの再構築にも及ぶ。

世界的に話題のOpenClawは、AIによるPC操作の潜在性を示した。

今回は、智谱もAutoGLM版OpenClawをリリース。

オリジナルは環境設定だけで半日かかるところ、公式サイトからワンクリックで展開可能に。

Twitter監視、情報整理、スクリプト作成まで、24時間365日の「デジタルインターン」がすぐに実現できる。

同時にリリースされたのがZ Code——

GLM-5の能力をフルに活用した次世代開発ツール。

Z Codeでは、ただ要求を伝えるだけ。モデルが自動的にタスクを分解し、複数のエージェントを起動して並行処理:コーディング、コマンド実行、デバッグ、プレビュー、最後にGitコミットまで自動化。

しかも、スマホからリモートでデスクトップのエージェントを指揮も可能。

特筆すべきは、OpenAIのCodexを使ってCodexを作ったように、Z CodeもまたGLMモデルが全工程に関わって開発された点だ。

国産計算力の勝利

GLMが世界的な流行とエージェント需要の急増を引き起こす裏で、「無名の英雄たち」が静かに大量の計算負荷を支えている。

すべてのコード、すべてのエージェント計画が安定して出力されるよう、GLM-5は中国の国産計算プラットフォームに深く入り込み、華為昇騰、摩尔线程、寒武紀、昆仑芯、沐曦、燧原、海光などの主流プラットフォームと深く適合。

底層の演算子レベルの最適化により、国産チップクラスター上でも「高スループット・低遅延」のフルパフォーマンスを実現。

これにより、最先端のモデルを持ちながらも、「技術的な封鎖」に阻まれることなく進める。

結び

2026年の春、プログラミング大規模モデルはついに稚気を脱ぎ捨てた。

Karpathyが言う「Agentic Engineering」の本質は、AIに対してより厳しい「面接要求」を突きつけることだ。

  • 以前(Vibe Coding):きれいなHTMLを書ければ採用
  • 今(Agentic Coding):Linuxカーネルや微サービスの呼び出し関係を理解し、オンラインを壊さずにコードをリファクタリングし、自らタスクを計画し、バグも修正できる。

GLM-5は完璧ではない。

しかし、「複雑なシステム構築」という核心命題において、現時点で唯一この「Agentic潮流」を受け止められるオープンソースの選手だ。

Vibe Codingは終わった。

もう「AIにウェブページを書いてもらえるか」と聞くのはやめよう。それは2025年の話だ。

今、彼に「この高並列システムのコアモジュールをリファクタリングしてくれるか」と尋ねてみてほしい。

GLM-5、準備完了!

彩蛋

GLM-5はすでにMaxユーザーパッケージに組み込まれ、Pro版は5日以内にサポート開始予定!

さらに、智谱は価格改定を発表したばかり。今年のToken価格は確実に上昇する見込みだ!

この記事は「新智元」より。

原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • コメント
  • リポスト
  • 共有
コメント
コメントを追加
コメントを追加
コメントなし
  • ピン