Gateアプリをダウンロードするにはスキャンしてください
qrCode
その他のダウンロードオプション
今日はこれ以上表示しない

今年のアトランタでのKubeConで、OpenAIのエンジニアがいくつかの重要なインフラストラクチャの知恵をドロップしました。彼らの応用可視性チームのファビアン・ポンセが、1つの設定をオフにするだけで約30,000 CPUコアを取り戻す方法を説明しました—そう、あなたはそれを正しく読みました。



彼らのセットアップ?Kubernetesクラスタ全体で毎日約10ペタバイトのログを処理しています。それは、わずかな非効率さが大規模なリソースの浪費に雪だるま式に膨れ上がるようなスケールです。どうやら、見落とされた1つのトグルがコアを狂ったように消費していたようです。

これが野生にさせる理由は、いくつかの複雑なリファクタリングや書き直しではなかったからです。ただの古典的な可観測性の作業です—無駄がどこにあるかを見つけて、それを取り除くこと。分散システムを大規模に運用している人にとって、これは実際に効果をもたらすような低いところにぶら下がっている果実です。時には、最大の勝利は構築するものではなく、オフにするものから来ることもあります。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 4
  • リポスト
  • 共有
コメント
0/400
Lonely_Validatorvip
· 11時間前
1つの設定スイッチで3万コアを節約?これが本当のコスト削減と効率向上だ、あの派手な最適化よりずっと信頼できる。
原文表示返信0
ponzi_poetvip
· 11時間前
30000個のCPUコアがたった一つの設定のために?これだけでどれだけの電気代が無駄になるんだろう、ちょっと理不尽だ。
原文表示返信0
token_therapistvip
· 11時間前
1つの設定スイッチで30000コアを救う、この男は本当にひどい、こちらではログを審査するだけで2ヶ月もかかる。
原文表示返信0
ImpermanentPhobiavip
· 11時間前
1つの設定で30000コアも節約できる?これはどれだけひどいパラメータ設定なんだろう 笑
原文表示返信0
  • ピン