Humans&のCoordinationモデル解説｜AIによる組織調整の実用化要件と技術的課題

Anthropic、OpenAI、Google DeepMindといった主要AIラボの出身者が設立した新興企業「Humans&（Humans and）」が、シードラウンドで4億8,000万ドル（約740億円）という異例の資金調達を実施しました。

彼らが掲げるのは、従来の「チャットボット」や「生成ツール」の延長線上にあるモデルではありません。複雑な利害関係を調整し、長期的なプロジェクトを管理する「社会的知性（Social Intelligence）」を備えた次世代基盤モデルの開発です。

本記事では、AIの技術パラダイムが「情報の生成」から「組織の調整（Coordination）」へ移行する背景と、Humans&が目指す技術的特異点、そして実用化に向けたハードルについて、技術責任者が押さえるべき視点で解説します。

1. インパクト要約：AIは「ツール」から「組織の中央神経系」へ

これまで市場を席巻してきたLLM（大規模言語モデル）の主な役割は、1対1の対話を通じた「タスクの処理」でした。コードを書く、メールを要約する、画像を生成するといった個別の作業効率化です。しかし、Humans&のアプローチは、この前提を根底から覆そうとしています。

Before/After：パラダイムの転換

比較軸	従来のAI（LLM）	Humans&が目指すAI（Coordination Model）
主な機能	情報検索・コンテンツ生成	意思決定の調整・合意形成
対話構造	1対1（ユーザー vs AI）	N対N（複数ユーザー間のハブ）
時間軸	瞬発的（数秒〜数分で完結）	長期的（数日〜数週間のプロジェクト管理）
成功定義	正確な回答を出力すること	関係者の合意を取り付け、プロジェクトを進めること
組織での役割	個人の生産性向上ツール	組織のハブ（中央神経系）

これまでは「SlackやNotionにAI機能が付く」ことが進化とされてきましたが、Humans&のビジョンが実現すれば「AIがSlackやNotionのようなコラボレーションツールの役割そのものを代替する」ことになります。

例えば、プロジェクトの進捗管理において、人間のPM（プロジェクトマネージャー）が各メンバーに状況を聞き回り、会議を設定し、要件定義のすり合わせを行う業務。これらをAIが自律的に行い、Slack上の膨大なスレッドを介さずに意思決定を完了させる世界線です。これは、マルチエージェントAIの概念を、さらに「人間とAIのハイブリッドチーム」における社会的調整へと昇華させたものと言えます。

2. 技術的特異点：なぜ「調整」が可能になるのか？

なぜ今、この技術が可能になりつつあるのか。Humans&の技術的優位性は、単なる言語能力の向上ではなく、強化学習（RL）の適用領域を拡張した点にあります。具体的には、Long-horizon RL（長期的計画）とMulti-agent RL（多エージェント間の最適化）の統合です。

2.1 Long-horizon RL：数手先ではなく「数週間先」を読む

現在のLLMは「次のトークン」を予測することに最適化されていますが、組織の調整には「数日後の会議のために、今誰に連絡すべきか」という長期的な因果関係の理解が必要です。

Humans&は、Eric Zelikman（CEO, 元xAI）やAndi Peng（元Anthropic）らの知見を活かし、長期間にわたるタスク遂行を報酬としてモデルを訓練しています。これにより、以下のような処理が可能になります。

状態空間の維持: プロジェクトの現状（State）を外部メモリやコンテキストとして保持し続け、日々の変化に応じて計画を動的に修正（Re-planning）する。
遅延報酬への対応: 「メールを送った」時点ではなく、「そのメールによって3日後に問題が解決した」時点で報酬を与える学習プロセス。

2.2 Social IntelligenceとMulti-agent RL

最も重要な技術的差別化要因は「社会的知性」の実装です。単に論理的に正しい解を出すのではなく、相手の意図や感情、政治的背景を推論する能力（Theory of Mind）をモデルに組み込もうとしています。

選好の調停: AさんとBさんの意見が対立した際、双方の妥協点を見つけ出す提案能力。
非言語的コンテキストの理解: 返信の遅さや文面から「忙しさ」や「乗り気でないこと」を察知し、アプローチを変える適応力。

これは、AIエージェントフレームワークで議論されているような、単一のエージェントがツールを使う段階を超え、複数の主体（人間およびAI）が織りなす複雑系を制御する試みです。

3. 次なる課題：実用化を阻む3つの技術的ボトルネック

4.8億ドルという巨額の資金は、計算リソースの確保だけでなく、これまでにない学習データの構築と評価手法の確立に向けられます。しかし、実用化には以下の深刻な技術的課題（Prerequisites）をクリアする必要があります。

3.1 「調整の成功」をどう数値化するか（Reward Modelingの難度）

コード生成AIであれば「テストが通ったか」で成否を100%判定できます。しかし、「会議の調整」や「利害の調整」は、客観的な正解定義が極めて困難です。

課題: 調整は完了したが、参加者の満足度が低い場合、それは成功か？
必要条件: 人間の主観的なフィードバック（RLHF）を、大規模かつ高精度に収集・モデリングする新たなパイプラインの確立。単なるGood/Badボタンではなく、文脈依存の評価指標が必要です。

3.2 膨大なコンテキストと推論コスト

組織の「中央神経系」として機能するには、社内の全ドキュメント、チャット履歴、メール、カレンダーをリアルタイムで把握し続ける必要があります。

課題: 全社員のコンテキストを常時推論に含めると、トークン数とコストが爆発的に増加する。
必要条件: RAG（検索拡張生成）の高度化だけでなく、AIが「今、何を参照すべきか」を自律的に判断するメタ認知能力、およびエピソード記憶の効率的な圧縮技術の実装。

3.3 権限委譲とセキュリティ（Authorization & Trust）

AIが「調整案を出す」だけでなく「決定して実行する（会議室を予約し、招待状を送る）」場合、誤動作のリスクは致命的です。

課題: 意図しない相手に機密情報を共有してしまうリスクや、誤った合意形成を行ってしまうリスク。
必要条件: エージェントエージェンシーの解説でも触れた通り、AIの行動に対するきめ細かな権限管理（Granular Permissioning）と、人間が介入すべきタイミングをAI自身が判断する「Confidence Threshold（確信度閾値）」の厳密な設計。

4. 今後の注目ポイント：技術責任者が追うべきKPI

Humans&の製品、あるいは同様の「Coordination AI」を評価する際、技術責任者は以下の指標に注目すべきです。単なるデモの派手さに惑わされてはいけません。

指標（KPI）	解説	合格ラインの目安（仮説）
Multi-turn Success Rate	1回の指示で完結せず、複数回のやり取りを経てタスクが完了した割合。	単純タスクで95%以上、複雑な調整で80%以上
Human Intervention Rate	AIの調整プロセスに人間が介入・修正を余儀なくされた頻度。	1プロジェクトあたり1〜2回以下への低減
Context Retention	数日前の指示や、暗黙の了解（「火曜は会議を避ける」など）をどれだけ維持できているか。	忘却による再指示率がほぼ0%であること
Time-to-Consensus	課題発生から合意形成（会議設定や方針決定）に至るまでのリードタイム。	人間のみの場合と比較して50%以上の短縮

特に注目すべきは、ベンチマークテストの変化です。従来のMMLUのような知識テストではなく、SWE-benchやGAIAのような、エージェントとしての遂行能力を測るベンチマークにおいて、「複数人との調整」を含むタスクでのスコアが公開されるかが鍵となります。

5. 結論

Humans&の登場は、AI技術の競争軸が「個の知能（IQ）」から「組織の知能（EQ/SQ）」へ移行したことを明確に示しています。彼らが目指すのは、SaaSツールの追加機能ではなく、企業の組織構造そのものを再定義する「調整レイヤー（Coordination Layer）」の覇権です。

技術責任者や事業責任者は、以下の準備を進めるべきです。

業務プロセスの棚卸し: 「調整」にどれだけのコストを払っているか可視化する。特に、情報伝達のためだけの会議や、日程調整の往復コストを特定する。
データ基盤の整備: AIが組織の文脈を理解できるよう、社内ドキュメントやコミュニケーションログのデジタル化・構造化を進める。
「AIマネージャー」への心理的準備: 人間がAIに「報告」し、AIから「指示」を受けるワークフローが部分的に始まることを想定し、組織設計を見直す。

Humans&が挑む「社会的知性」の実装は、技術的なハードルが極めて高い挑戦です。しかし、これが達成された時、我々が知る「会社組織」のあり方は、不可逆的に変化することになるでしょう。