Отсканируйте, чтобы загрузить приложение Gate
qrCode
Больше вариантов загрузки
Не напоминай мне больше сегодня.

Утренние мысли о путях развития ИИ.



Сейчас в этой области формируется интересное разделение. В то время как большинство лабораторий ИИ ведут гонку за количество параметров — используя больше вычислений, больше данных для все более крупных моделей — некоторые проекты делают другую ставку.

Подход Sentient AGI? Они не гонятся за размером. Они стремятся к более умной архитектуре рассуждений. Это классическая дискуссия: грубая сила против элегантных решений.

Подумайте об этом — означает ли больший мозг автоматически лучшее мышление? Или дело в том, насколько эффективно вы обрабатываете и связываете идеи?

Индустрия одержима GPT-5, GPT-6 и тем, что будет дальше с триллионами параметров. Но, возможно, настоящий прорыв не в масштабе. Возможно, он заключается в обучении моделей действительно рассуждать о проблемах, а не просто в сопоставлении образцов на стероидах.

Не скажу, что один подход определенно лучше. Просто отмечаю, что теперь не все играют в одну и ту же игру.
Посмотреть Оригинал
На этой странице может содержаться сторонний контент, который предоставляется исключительно в информационных целях (не в качестве заявлений/гарантий) и не должен рассматриваться как поддержка взглядов компании Gate или как финансовый или профессиональный совет. Подробности смотрите в разделе «Отказ от ответственности» .
  • Награда
  • 5
  • Репост
  • Поделиться
комментарий
0/400
ContractHuntervip
· 11ч назад
Старая система параметров уже устарела, настоящая гонка - это эффективность вывода Слушать, что много параметров означает высокий IQ, звучит абсурдно... У Sentient есть интересная идея, но говорить, что они уже победили, слишком рано Все стремятся к масштабу, а эта компания идет по пути утонченности? Это немного азартно Правда ли, что элегантные решения могут победить грубую силу? Я сомневаюсь Но, говоря о другом, сопоставление моделей ≠ вывод, это действительно ложная проблема
Посмотреть ОригиналОтветить0
AirdropCollectorvip
· 11ч назад
А, значит, те люди, которые зациклены на параметрах, вероятно, сбились с пути. Настоящий интеллект не в количестве, а в качестве. Я немного подумал над этой логикой, и она кажется вечным противоречием оптимизации против грубой силы, интересно. Много параметров — это гарантирует хорошее решение? Не обязательно, я думаю, важен сам дизайн архитектуры. Осталось только посмотреть, кто в итоге сможет смеяться последним.
Посмотреть ОригиналОтветить0
ReverseTradingGuruvip
· 11ч назад
Настройка параметров рано или поздно приведет к провалу, как же трудно понять, что качество > количество. Даже если модель большая, это не делает ее умнее, ключевым остается наличие логической цепочки. Эти ребята из Sentient, похоже, все поняли, вместо того чтобы следовать за модой на параметры, они выбрали иной путь. Если говорить прямо, это вопрос изящества против грубой силы, индустрия все еще тратит деньги на параметры, а они уже сменили подход. Кажется, что путь больших моделей подходит к концу, дальше придется бороться за способность к рассуждению. Сколько бы параметров ни насобирали, это не изменит суть сопоставления образцов, это давно следовало понять. Проблема в том, кто сможет создать действительно мыслящую архитектуру, на это еще предстоит посмотреть. Хватит с этой теорией о масштабах, главное, чтобы голова работала.
Посмотреть ОригиналОтветить0
blockBoyvip
· 11ч назад
Параметры не обязательно являются решением, мне нравится путь умной архитектуры --- Чем больше параметров, тем более умным? Чепуха, эффективность - вот что действительно важно --- Не все гонятся за GPT-X, с этим я согласен --- Качество > количество, наконец-то кто-то сказал это ясно --- Рассуждение > сопоставление шаблонов, вот в чем разница --- Чувствую, что путь больших моделей идет не в ту сторону, нужно переосмыслить --- Sentient - это хороший шаг, пока все остальные гонятся за параметрами, они гонятся за архитектурой --- Весь круг был промыт мозги триллионами параметров, это немного утомляет
Посмотреть ОригиналОтветить0
DefiEngineerJackvip
· 11ч назад
нет, количество параметров cope так 2023. эмпирически говоря, вы просто бросаете вычисления на стену, надеясь, что что-то прилипнет — это не оптимизация, это просто... дорогое грубое насилие, если честно. архитектура рассуждений действительно имеет значение, если вы хотите получить нетривиальные приросты производительности. большинство лабораторий не признает это, потому что они уже сожгли миллиарды на ставке на масштаб, лол.
Посмотреть ОригиналОтветить0
  • Закрепить