Замечал что-то диковинное в последнее время - некоторые AI модели, такие как Sonnet 4.5, apparently могут работать более 30 часов подряд, и Codex не отстает с его расширенными рабочими окнами. Это заставило меня задуматься о архитектуре, стоящей за этим.

Кто-нибудь сталкивался с научными работами или техническими документами, которые углубляются в то, как эти системы поддерживают такие долгие сеансы вывода? Интересно, связано ли это с инновациями в архитектуре моделей, оптимизацией инфраструктуры или чем-то совершенно другим. Буду рад увидеть, что говорит исследовательское сообщество о этой способности.

Посмотреть Оригинал

На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .

17 Лайков