banner

ブログ

Jul 07, 2023

AI の大家

Chris Sharp 氏は Digital Realty の CTO です

: データセンターと AI エコノミーにとってモジュール性が重要となる理由

過去 1 年にわたる大規模な商用 AI、特に ChatGPT などの新しい生成 AI アプリケーションの突然の出現により、これらのアプリケーションが存在するデータセンター施設に新たな一連の技術要件が課せられました。 これらをサポートするインフラストラクチャは、20 年前に建設された可能性のある施設内で、これまで以上に多くの電力を消費し、より多くのデータを処理し、より多くの帯域幅を使用することになります。 これらの設備は、場合によってはラックあたりの消費電力が桁違いに増加する可能性をサポートするために適応する必要があります。

大規模な言語モデルと、次のワークロードの波がコンピューティング、ネットワーキング、データセンターの設計に何を意味するかについての 7 部構成の記事

これを実現する唯一の方法は、モジュール設計を使用することです。

データセンターは非常に静的なエンティティのように見えるかもしれません。 これらは通常、屋外に発電機やその他の機器が何列も並んだ巨大なレンガとモルタルの建物で、通常の日常的な条件から送電網の完全停電に至るまで、あらゆる状況下で施設が稼働し続けるように慎重に設計されています。中断。 しかし、現代のデータセンターは決して静的なものではありません。 多くの施設は最初から高度にモジュール化されるように設計されており、特定のデータセンター フロアは、必要に応じて年に数回、ネットワーク トポロジ、エアフローの考慮事項、物理的冗長性の変更に適応させることができます。 このニーズは何によって引き起こされ、どのように満たされるのでしょうか?

データセンターにおける AI 導入の広範囲にわたる出現は、顧客の要件がいかに急速に変化するかを示しています。 データセンター事業者が顧客機器のラックあたり平均 10 キロワットの消費電力を計画できたのは昨年だけですが、その全体のさまざまな場所で 25、50、さらには 100 キロワットのラックのブロックがますます大規模になる必要があります。同じデータセンター施設がここにあり、今後も成長し続けるでしょう。 従来の静的設計では、パフォーマンス、メンテナンス、冗長性の点で多くの問題が発生する可能性があります。

まず、このような高密度ラックは、最高レベルの効率で動作させるために、より多くのネットワーク帯域幅を必要とすることがよくあります。 これは見落とされがちですが、このような高密度のラック (または 10 個、または 100 個) を導入したにもかかわらず、必要な帯域幅を確保できない場合、顧客は非常に不満を抱くでしょう。

第 2 に、データ センターのフロア全体で消費電力が不均一に増加すると、この種のホット スポットに対応するように設計されていない冷却システムに負荷がかかることがよくあります。 データセンターの列の一方の端に高密度のラックがあると、もう一方の端の温度が上昇しやすくなります。

最後に、回復力と冗長性の対策は、特定の電気負荷が施設全体のどこにあるか、およびそれらがどのように分散されているかに基づいています。 非常に高密度の機器クラスターが 1 つのエリアに追加された場合、静的設計では十分な信頼性の高い発電機容量でカバーすることができない可能性があります。

ご想像のとおり、AI の顧客にとって、これらの懸念はそれぞれ、AI 機器を最大限のパフォーマンスで動作させることができないことから、停電やその他のストレスが発生した場合に望ましくないダウンタイムが発生する可能性まで、重大な問題です。地域の電力網。 適応性の高いモジュラー設計フレームワークを使用することで、どの時代のデータセンターでもこれらの問題に対処できます。

1 つは、施設の最初からスペースを再利用したり、追加のネットワーク ルームとして使用するように設計したりして、より多くのネットワーク回線、スイッチ、ルーターを設置して、時間の経過とともに顧客のネットワーク帯域幅を拡大できるようにすることです。 さらに、オーバーヘッド ケーブル トレイを設計および展開するモジュラー方式により、データセンター オペレータは、静的で柔軟性のない設計では見落とされがちな接続を顧客に物理的に提供できます。 InfiniBand などの一部の AI 対応テクノロジーでは、大規模で重いケーブル配線を使用することがありますが、実際のパフォーマンスや運用上の問題を将来的に回避するには、モジュール式でしか設置できない可能性があります。

共有