SKグループのカリフォルニアでのAIデータセンター試験施設

この記事で分かること

① どんな試験を行うのか

1ラックあたり40〜100kW級の超高密度AIサーバーを24時間稼働させ、次世代の「液体冷却ソリューション」の効率比較や、国際標準である独自の「通信・制御システム」の実証試験などを行います。

② なぜカリフォルニアで行うのか

NVIDIAなどの最重要パートナーや、Google、Metaといった巨大顧客が集まるシリコンバレーで、次世代の稼働実績を直接提示し、AIインフラの世界標準(デファクト)の主導権を握るためです。

③ 異種チップ混合とは何か

役割の異なる複数種類の半導体(CPU、GPU、NPUなど)を組み合わせ、適材適所の分業で処理を行う方式です。AIの爆発的な計算量に対し、圧倒的な処理速度の向上と省電力を同時に実現できます。

SKグループのカリフォルニアでのAIデータセンター試験施設

 韓国のSKグループが米国カリフォルニア州にAIデータセンターの試験施設(テストベッド)の建設を推進していることが報じられています。

 今回の計画は単なるデータセンターの増設ではなく、HBMの供給元という半導体サプライヤーの立場を超え、AIインフラの設計・構築・運用までを網羅する『AIシステムプロバイダー』へとSKグループが脱皮するための、極めて実戦的な布石と言えます。

どんな試験を行うのか

 SKグループがカリフォルニアに建設するAIデータセンター試験施設(テストベッド)で行われる試験は、単に「サーバーが動くか」を確認するレベルのものではありません。

 AI処理の劇的な高負荷化に耐えうる「次世代インフラの限界テスト」と、SKが目指す「国際標準(デファクトスタンダード)の検証」が主な目的です。具体的には、以下の4つの領域で高度な実証試験が行われます。

3大「次世代液体冷却(液冷)ソリューション」の比較・検証

 AIデータセンター最大の課題である「莫大な発熱」を抑えるため、従来の空冷(ファン)に代わる3つの液体冷却システムを同時に稼働させ、効率や安定性を直接比較する試験を行います。

  • ダイレクト液冷(Direct Liquid Cooling): 発熱するチップ(GPU等)の表面に直接冷却プレートを密着させ、液体を循環させて冷やす技術。
  • 浸漬冷却(Immersion Cooling): サーバー全体を電気を通さない特殊なオイル(不伝導性液体)の中にドボリと沈めて丸ごと冷やす革新的な技術。
  • 精密液冷(Precision Liquid Cooling): 発熱が特に激しい特定の超高密度エリアだけに絞ってピンポイントで液体を吹き付ける技術。

試験のポイント:

NVIDIAの次世代GPUやSK hynixのHBMを搭載した高出力サーバーラック(1ラックあたり40kW〜100kWという、従来データセンターの4〜10倍の熱を出すモンスターマシン)を実際に24時間フル稼働させ、どの冷却方式が最も低コストで、かつ故障率を下げられるかを検証します。

国際標準「3レイヤー・シグナリング」の相互運用テスト

 2026年3月、SK Telecomが提案したAIデータセンターの通信・相互接続フレームワークが、国際電気通信連合(ITU-T)の国際標準として正式承認されました。このカリフォルニアの施設は、その国際標準が「現場で本当に正しく機能するか」を実証するメインステージになります。

 インフラを以下の3層に分け、それぞれのシステムがエラーを起こさずに有機的にデータや信号(シグナリング)をやり取りできるかを試験します。

レイヤー(階層)試験・検証する内容
① サービス層AIモデルの認証、サービス利用のステータス監視、リソース割り当ての最適化。
② 管理層データセンター全体の運用管理、サイバーセキュリティ、電力効率の最適化。
③ インフラ層GPU、HBM、冷却システム、電源システムなどの物理ハードウェアの連動。

「異種チップ混合(ヘテロジニアス)」サーバーの最適化

 NVIDIA一強の市場に対し、SKグループはコスト効率の高い次世代サーバーアーキテクチャの試験を行います。

 SKは英Arm、および韓国のAI半導体スタートアップ「Rebellions(リベリオンズ)」との3社アライアンスを発表しています。

  • CPU+NPUの最適化試験: ArmのAI向けCPUと、Rebellionsの最新AIアクセラレータ(RebelCardなど)を組み合わせた「推論(Inference)専用サーバー」を構築。
  • SK製メモリの限界測定: SK hynixの最先端HBMや大容量SSDを組み合わせ、大規模言語モデル(LLM)を動かした際のボトルネック(データの目詰まり)がどこで発生するかをシミュレーションします。

エネルギー最適化と独自AI管理ソフト(AI DC IM)のテスト

 米国の実環境(電力網や気候)において、データセンター全体のエネルギー効率(PUE)を極限まで下げるためのソフトウェア試験を行います。

  • AI DC Infrastructure Manager(インフラ管理者): 独自開発のAIソフトを用い、サーバーの処理負荷に応じて冷却液の循環スピードや電力をリアルタイムで自動制御する試験。
  • 分散型電源との連動テスト: 将来的な巨大データセンター(ギガワット級)を見据え、水素燃料電池や再生可能エネルギー(太陽光・風力)などの不安定な電源から電力を供給された際に、サーバーが電圧低下を起こさず安定稼働するかをミニチュア環境で再現・テストします。

 テストベッドで得られた「液体冷却のデータ」や「Arm/Rebellionsチップでの稼働実績」をそのまポートフォリオ(パッケージ化されたソリューション)として、アメリカのビッグテック企業やAIスタートアップに提示し、グローバル市場への売り込みを即座に開始するための戦略的な実験場となっています。

SKグループの米試験施設では、1ラックあたり40〜100kW級の超高密度AIサーバーを24時間稼働させ、次世代の「液体冷却ソリューション」の効率比較や、国際標準の「通信・制御システム」の実証試験などを行います。

なぜカリフォルニアで行うのか

 SKグループが試験施設(テストベッド)を他の地域ではなく、あえて米国カリフォルニア(シリコンバレー近郊)に建設する理由は、主に以下の3点に集約されます。

1. パートナー企業や「顧客(ビッグテック)」との距離の近さ

 カリフォルニアには、AIインフラの鍵を握る最重要パートナーや顧客が集中しています。

  • NVIDIA・AMD・Intelといった主要半導体企業の本社
  • Apple、Google、Metaなどの巨大ハイパースケーラー(データセンター需要家)
  • Anthropic(SKが1億ドルを出資・提携)などの主要AI企業

 この地に施設を置くことで、NVIDIAの次世代GPUの最新プロトタイプをいち早く組み込んで共同検証したり、現地の顧客に「実際の稼働データ」をその場で見せて売り込んだりするスピード感が手に入ります。

2. シlicon Valleyの「最先端AIエコシステム」との直接連動

 SKグループは、米国拠点を活用したグローバル展開を2026年に入り一気に加速させています。

  • AI Co.(仮称)の設立: SK hynixは2026年、カリフォルニアにある子会社ソリダイムの構造再編を経て、米国に大がかりなAIソリューション専門の新会社を立ち上げています。
  • ADR(米国預託証券)の株式上場: SK hynixは2026年8月にも米国の取引所(ナスダック等)への上場を計画しており、米国の投資家や市場に対して「単なるメモリメーカーではなく、AIインフラ企業である」という強い存在感をアピールする材料になります。

3. グローバル標準(デファクトスタンダード)の主導権争い

 AIデータセンターの運用ルールや液体冷却の規格は、まだ世界的なデファクトスタンダード(事実上の標準)が確立されていません。

 自社が開発した独自の冷却制御技術や、2026年3月に国際標準(ITU-T)として承認された通信フレームワークを、AIのトレンド発信地である米国市場の実環境で適用し、実績(トラックレコード)を作ることで、世界標準の主導権を握る狙いがあります。

 「AIの心臓部(シリコンバレー)に陣取り、最先端のチップや顧客とリアルタイムで融合しながら、自社の技術を世界標準に育てるため」です。

NVIDIAなどの主要パートナーや、Google、Metaといった巨大顧客(ビッグテック)が集中するシリコンバレーで、次世代の稼働実績を直接示し、AIインフラの世界標準(デファクト)の主導権を握るためです。

異種チップ混合とは何か

 異種チップ混合(ヘテロジニアス・コンピューティング / Heterogeneous Computing)とは、役割や得意分野が異なる複数種類の半導体チップ(プロセッサ)を組み合わせ、一つのシステムとして協調させて処理を行う方式のことです。

 これまでは「頭脳(CPU)」がすべての処理を器用にこなすのが主流でしたが、AIの登場によって処理量が爆発的に増えたため、「全員で得意分野を分担して超高速化しよう」というアプローチが不可欠になりました。

なぜ異種チップ混合が必要なのか?(分業のイメージ)

 人間の組織にたとえると、以下のような「適材適所」のチームを作るイメージです。

  • CPU(中央演算処理装置):汎用的な処理のプロ
    • 役割: システム全体の司令塔。複雑なルールの処理や、全体のスケジュール管理が得意。(例:Arm製、Intel製、AMD製のCPU)
  • GPU(画像処理装置):大量の並列計算のプロ
    • 役割: 何千もの単純な計算を同時にこなす。AIの「学習(膨大なデータの読み込み)」に圧倒的な強みを持つ。(例:NVIDIAのH100/B200など)
  • NPU / ASIC(AI専用プロセッサ):特定のAI処理だけのプロ
    • 役割: 特定のAIアルゴリズム(特に「推論」や画像認識など)の計算「だけ」を、超低電力・超高速で行う。(例:GoogleのTPU、RebellionsのRebelなど)

主なメリット

  1. 圧倒的な電力効率(省エネ)汎用的なCPUに無理やりAIの計算をさせると大量の電力を消費しますが、AI専用のNPUに任せれば、わずかな電力で何倍ものスピードで処理できます。データセンターの電気代や発熱を抑える切り札です。
  2. コストの最適化現在、NVIDIAの最高峰GPUは世界中で深刻な争奪戦となっており、価格も非常に高価です。そこで、「全体の制御は安価で電力効率の良いArm製CPUで行い、特定の処理だけを安価な専用NPUに任せる」という組み合わせにすれば、高価なGPUの数を減らし、システム全体のコストを劇的に下げられます。

今、なぜ注目されているのか?

 半導体の微細化(物理的な進化)が限界に近づきつつある中、チップ単体の性能を上げるだけではAIの進化スピードに追いつかなくなっています。

 そのため、現在のAIデータセンターや最先端のスマートフォン(Apple IntelligenceやGoogle PixelのAI機能など)では、「CPU、GPU、NPU、そして超高速メモリ(HBMなど)をどう組み合わせて、一つの生き物のように効率よく動かすか」という異種チップ混合の設計技術が、ハイテク企業の命運を握る最重要テーマになっています。

役割や得意分野の異なる複数種類の半導体(CPU、GPU、NPUなど)を組み合わせ、適材適所の分業体制で処理を行う方式です。AIの爆発的な計算量に対し、圧倒的な処理速度の向上と省電力を両立できます。

コメント

タイトルとURLをコピーしました