Lors de la KubeCon de cette année à Atlanta, un ingénieur d'OpenAI a partagé une sagesse sérieuse sur l'infrastructure. Fabian Ponce de leur équipe d'observabilité appliquée a expliqué comment ils ont récupéré environ 30 000 CPU—oui, vous avez bien lu—juste en désactivant un paramètre de configuration.
Leur configuration ? Traitement de près de 10 pétaoctets de journaux quotidiennement sur leurs clusters Kubernetes. C'est à cette échelle que même les petites inefficacités se transforment en énormes gaspillages de ressources. Il s'avère qu'un seul commutateur négligé brûlait des cœurs comme un fou.
Ce qui rend cela sauvage : ce n'était pas un refactoring ou une réécriture élaborée. Juste un bon vieux travail d'observabilité : trouver où se trouve le gaspillage et l'éliminer. Pour quiconque gérant des systèmes distribués à grande échelle, c'est le genre de fruits à portée de main qui fait vraiment bouger les choses. Parfois, les plus grands gains viennent de ce que vous éteignez, et non de ce que vous construisez.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
13 J'aime
Récompense
13
4
Reposter
Partager
Commentaire
0/400
Lonely_Validator
· Il y a 11h
Un simple interrupteur de configuration a permis d'économiser 30 000 cœurs ? C'est ça, la véritable réduction des coûts et l'augmentation de l'efficacité, bien plus fiable que ces optimisations compliquées.
Voir l'originalRépondre0
ponzi_poet
· Il y a 11h
30 000 cœurs de CPU juste à cause d'une configuration ? Combien cela va-t-il coûter en électricité, c'est un peu absurde.
Voir l'originalRépondre0
token_therapist
· Il y a 11h
Un interrupteur de configuration sauve 30 000 cœurs, ce gars est trop dur, chez nous, rien que pour examiner les journaux, ça prend deux mois.
Voir l'originalRépondre0
ImpermanentPhobia
· Il y a 11h
Une configuration permet d'économiser 30 000 cœurs ? Quels paramètres ridicules cela doit être haha
Lors de la KubeCon de cette année à Atlanta, un ingénieur d'OpenAI a partagé une sagesse sérieuse sur l'infrastructure. Fabian Ponce de leur équipe d'observabilité appliquée a expliqué comment ils ont récupéré environ 30 000 CPU—oui, vous avez bien lu—juste en désactivant un paramètre de configuration.
Leur configuration ? Traitement de près de 10 pétaoctets de journaux quotidiennement sur leurs clusters Kubernetes. C'est à cette échelle que même les petites inefficacités se transforment en énormes gaspillages de ressources. Il s'avère qu'un seul commutateur négligé brûlait des cœurs comme un fou.
Ce qui rend cela sauvage : ce n'était pas un refactoring ou une réécriture élaborée. Juste un bon vieux travail d'observabilité : trouver où se trouve le gaspillage et l'éliminer. Pour quiconque gérant des systèmes distribués à grande échelle, c'est le genre de fruits à portée de main qui fait vraiment bouger les choses. Parfois, les plus grands gains viennent de ce que vous éteignez, et non de ce que vous construisez.