Замечал что-то диковинное в последнее время - некоторые AI модели, такие как Sonnet 4.5, apparently могут работать более 30 часов подряд, и Codex не отстает с его расширенными рабочими окнами. Это заставило меня задуматься о архитектуре, стоящей за этим.
Кто-нибудь сталкивался с научными работами или техническими документами, которые углубляются в то, как эти системы поддерживают такие долгие сеансы вывода? Интересно, связано ли это с инновациями в архитектуре моделей, оптимизацией инфраструктуры или чем-то совершенно другим. Буду рад увидеть, что говорит исследовательское сообщество о этой способности.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
17 Лайков
Награда
17
5
Репост
Поделиться
комментарий
0/400
NewDAOdreamer
· 8ч назад
30 часов? Да ты шутишь... Это же сколько ресурсов нужно, действительно кто-то так использовал?
Посмотреть ОригиналОтветить0
TaxEvader
· 8ч назад
30 часов непрерывной работы? Сколько это обойдется в электроэнергию, это немного абсурдно.
Посмотреть ОригиналОтветить0
SchroedingerAirdrop
· 8ч назад
30 часов без отключения? Сколько электричества это потребует?
Посмотреть ОригиналОтветить0
GasFeeCrying
· 8ч назад
30 часов без простоев, эта цифра просто абсурдна, правда?
Посмотреть ОригиналОтветить0
GasGasGasBro
· 9ч назад
30 часов непрерывного бега? Это, черт возьми, жжет видеопамять или какое-то черное волшебство?
Замечал что-то диковинное в последнее время - некоторые AI модели, такие как Sonnet 4.5, apparently могут работать более 30 часов подряд, и Codex не отстает с его расширенными рабочими окнами. Это заставило меня задуматься о архитектуре, стоящей за этим.
Кто-нибудь сталкивался с научными работами или техническими документами, которые углубляются в то, как эти системы поддерживают такие долгие сеансы вывода? Интересно, связано ли это с инновациями в архитектуре моделей, оптимизацией инфраструктуры или чем-то совершенно другим. Буду рад увидеть, что говорит исследовательское сообщество о этой способности.