На цьогорічній KubeCon в Атланті інженер OpenAI поділився серйозною мудрістю щодо інфраструктури. Фабіан Понсе з їхньої команди прикладної спостережливості розповів, як їм вдалося повернути приблизно 30,000 CPU ядер—так, ви правильно прочитали—просто вимкнувши одне налаштування конфігурації.
Їхня установка? Обробка близько 10 петабайтів журналів щоденно на їхніх кластерах Kubernetes. Це такий масштаб, де навіть незначні неефективності перетворюються на величезні витрати ресурсів. Виявляється, один недоглянутий перемикач спалював ядра, як божевільний.
Що робить це диким: це не було якимось складним переробленням або переписуванням. Просто стара добра робота з обсервабельності—знаходження місць, де є витрати, і їх усунення. Для всіх, хто керує розподіленими системами в масштабах, це той вид легкодоступного ресурсу, який насправді змінює ситуацію. Іноді найбільші виграші приходять від того, що ви вимикаєте, а не від того, що ви будуєте.
Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
13 лайків
Нагородити
13
4
Репост
Поділіться
Прокоментувати
0/400
Lonely_Validator
· 11год тому
Один перемикач конфігурації зекономив 30000 ядер? Це справжнє зниження витрат і підвищення ефективності, набагато надійніше, ніж всі ці пишні оптимізації.
Переглянути оригіналвідповісти на0
ponzi_poet
· 11год тому
30000 CPU-ядр через одну конфігурацію? Скільки це коштує електроенергії, це трохи абсурдно.
Переглянути оригіналвідповісти на0
token_therapist
· 11год тому
Один перемикач конфігурації рятує 30000 ядер, цей хлопець занадто жорсткий, у нас тут лише перевірка журналів займає два місяці.
Переглянути оригіналвідповісти на0
ImpermanentPhobia
· 11год тому
Одна конфігурація економить 30000 ядер? Які ж це абсурдні параметри налаштування, ха-ха
На цьогорічній KubeCon в Атланті інженер OpenAI поділився серйозною мудрістю щодо інфраструктури. Фабіан Понсе з їхньої команди прикладної спостережливості розповів, як їм вдалося повернути приблизно 30,000 CPU ядер—так, ви правильно прочитали—просто вимкнувши одне налаштування конфігурації.
Їхня установка? Обробка близько 10 петабайтів журналів щоденно на їхніх кластерах Kubernetes. Це такий масштаб, де навіть незначні неефективності перетворюються на величезні витрати ресурсів. Виявляється, один недоглянутий перемикач спалював ядра, як божевільний.
Що робить це диким: це не було якимось складним переробленням або переписуванням. Просто стара добра робота з обсервабельності—знаходження місць, де є витрати, і їх усунення. Для всіх, хто керує розподіленими системами в масштабах, це той вид легкодоступного ресурсу, який насправді змінює ситуацію. Іноді найбільші виграші приходять від того, що ви вимикаєте, а не від того, що ви будуєте.