في مؤتمر KubeCon لهذا العام في أتلانتا، قدم مهندس من OpenAI بعض الحكمة الجادة بشأن البنية التحتية. استعرض فابيان بونس من فريق المراقبة التطبيقية لديهم كيفية استعادة حوالي 30,000 CPU cores—نعم، لقد قرأت ذلك بشكل صحيح—فقط عن طريق إيقاف إعداد واحد.
إعدادهم؟ معالجة ما يقرب من 10 بيتابايت من السجلات يوميًا عبر مجموعات Kubernetes الخاصة بهم. هذه هي نوعية النطاق الذي حتى الكفاءات الصغيرة تتضخم إلى استنزاف ضخم للموارد. اتضح أن مفتاحًا واحدًا تم تجاهله كان يحرق النوى بشكل جنوني.
ما يجعل هذا مثيرًا: لم يكن إعادة هيكلة أو إعادة كتابة معقدة. مجرد عمل مراقبة قديم الطراز - العثور على أماكن الهدر واستئصاله. بالنسبة لأي شخص يدير أنظمة موزعة على نطاق واسع، هذا هو النوع من المكافآت السهلة التي تحرك الأمور بالفعل. أحيانًا تأتي أكبر المكاسب مما تقوم بإيقافه، وليس مما تبنيه.
شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
تسجيلات الإعجاب 13
أعجبني
13
4
إعادة النشر
مشاركة
تعليق
0/400
Lonely_Validator
· منذ 11 س
هل يوفر مفتاح التكوين 30000 نواة؟ هذه هي الكفاءة الحقيقية في خفض التكاليف وزيادة الإنتاجية، فهي أكثر موثوقية بكثير من تلك التحسينات المبالغ فيها.
شاهد النسخة الأصليةرد0
ponzi_poet
· منذ 11 س
30000 نواة CPU فقط بسبب إعداد واحد؟ كم من فاتورة الكهرباء ستضيع؟ هذا أمر غير معقول بعض الشيء.
شاهد النسخة الأصليةرد0
token_therapist
· منذ 11 س
مفتاح تكوين واحد ينقذ 30000 نواة، هذا الرجل قاسي جداً، نحن هنا نقضي شهرين فقط في مراجعة السجلات.
شاهد النسخة الأصليةرد0
ImpermanentPhobia
· منذ 11 س
إعداد واحد يوفر 30000 نواة؟ يجب أن تكون إعدادات المعلمات هذه غريبة جداً هاها
في مؤتمر KubeCon لهذا العام في أتلانتا، قدم مهندس من OpenAI بعض الحكمة الجادة بشأن البنية التحتية. استعرض فابيان بونس من فريق المراقبة التطبيقية لديهم كيفية استعادة حوالي 30,000 CPU cores—نعم، لقد قرأت ذلك بشكل صحيح—فقط عن طريق إيقاف إعداد واحد.
إعدادهم؟ معالجة ما يقرب من 10 بيتابايت من السجلات يوميًا عبر مجموعات Kubernetes الخاصة بهم. هذه هي نوعية النطاق الذي حتى الكفاءات الصغيرة تتضخم إلى استنزاف ضخم للموارد. اتضح أن مفتاحًا واحدًا تم تجاهله كان يحرق النوى بشكل جنوني.
ما يجعل هذا مثيرًا: لم يكن إعادة هيكلة أو إعادة كتابة معقدة. مجرد عمل مراقبة قديم الطراز - العثور على أماكن الهدر واستئصاله. بالنسبة لأي شخص يدير أنظمة موزعة على نطاق واسع، هذا هو النوع من المكافآت السهلة التي تحرك الأمور بالفعل. أحيانًا تأتي أكبر المكاسب مما تقوم بإيقافه، وليس مما تبنيه.