En KubeCon de este año en Atlanta, un ingeniero de OpenAI compartió una sabia lección sobre infraestructura. Fabian Ponce de su equipo de observabilidad aplicada explicó cómo recuperaron aproximadamente 30,000 CPU—sí, leíste bien—simplemente desactivando una configuración.
¿Su configuración? Procesando cerca de 10 petabytes de registros diarios a través de sus clústeres de Kubernetes. Esa es la escala en la que incluso las ineficiencias más pequeñas se convierten en enormes pérdidas de recursos. Resulta que un solo interruptor pasado por alto estaba consumiendo núcleos a un ritmo impresionante.
Lo que lo hace salvaje: no fue una refactorización o reescritura elaborada. Solo un trabajo de observabilidad a la antigua: encontrar dónde vive el desperdicio y eliminarlo. Para cualquiera que ejecute sistemas distribuidos a gran escala, este es el tipo de fruta de bajo colgante que realmente mueve la aguja. A veces, las mayores victorias provienen de lo que apagas, no de lo que construyes.
Ver originales
Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.
13 me gusta
Recompensa
13
4
Republicar
Compartir
Comentar
0/400
Lonely_Validator
· hace11h
¿Un interruptor de configuración ahorra 30,000 núcleos? Esto es una verdadera reducción de costos y aumento de eficiencia, mucho más confiable que esas optimizaciones llamativas.
Ver originalesResponder0
ponzi_poet
· hace11h
¿30,000 núcleos de CPU solo por una configuración? ¿Cuánto dinero en electricidad se desperdiciará? Es un poco ridículo.
Ver originalesResponder0
token_therapist
· hace11h
Un interruptor de configuración salva 30000 núcleos, este tipo es demasiado duro, aquí solo revisar los registros nos lleva dos meses.
Ver originalesResponder0
ImpermanentPhobia
· hace11h
¿Una configuración ahorra 30000 núcleos? ¡Qué configuración tan absurda, jajaja!
En KubeCon de este año en Atlanta, un ingeniero de OpenAI compartió una sabia lección sobre infraestructura. Fabian Ponce de su equipo de observabilidad aplicada explicó cómo recuperaron aproximadamente 30,000 CPU—sí, leíste bien—simplemente desactivando una configuración.
¿Su configuración? Procesando cerca de 10 petabytes de registros diarios a través de sus clústeres de Kubernetes. Esa es la escala en la que incluso las ineficiencias más pequeñas se convierten en enormes pérdidas de recursos. Resulta que un solo interruptor pasado por alto estaba consumiendo núcleos a un ritmo impresionante.
Lo que lo hace salvaje: no fue una refactorización o reescritura elaborada. Solo un trabajo de observabilidad a la antigua: encontrar dónde vive el desperdicio y eliminarlo. Para cualquiera que ejecute sistemas distribuidos a gran escala, este es el tipo de fruta de bajo colgante que realmente mueve la aguja. A veces, las mayores victorias provienen de lo que apagas, no de lo que construyes.