Gateアプリをダウンロードするにはスキャンしてください
qrCode
その他のダウンロードオプション
今日はこれ以上表示しない

AI開発の道に関する朝の思考。



現在、この分野で興味深い分裂が形成されています。ほとんどのAIラボがパラメータ数のための軍拡競争にあり、ますます巨大なモデルに対してより多くのコンピュートやデータを投じている一方で、いくつかのプロジェクトは異なる賭けをしています。

センティエントAGIのアプローチは?彼らは規模を追求しているわけではない。彼らはよりスマートな推論アーキテクチャを追求している。それは古典的な議論だ: brute force対エレガントな解決策。

考えてみてください—大きな脳は自動的により良い思考を意味しますか?それともアイデアを処理し、つなげる効率性の問題ですか?

業界はGPT-5、GPT-6、次に来る何かに夢中になっており、トリリオンのパラメータを持っています。しかし、本当のブレークスルーはスケールにあるのではなく、実際に問題を推論するようにモデルを教育することにあるのかもしれません。ただ単にパターンマッチングをするのではなく。

一つのアプローチが絶対的に優れているとは言っていない。ただ、もう誰もが同じゲームをしているわけではないことに注意している。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 5
  • リポスト
  • 共有
コメント
0/400
ContractHuntervip
· 9時間前
パラメータの罠はとっくに時代遅れで、真のレースは推論効率だ。 nglパラメータが多いほど知能が高いというのは、聞こえが滑稽だ... Sentientのこのアイデアには少し期待が持てるが、今の段階で勝ったと言うには早すぎる。 みんな規模で競争しているのに、ここだけが精巧な路線を行く?ちょっと賭けの要素があるな。 本当に優雅な解決策が力任せに勝てるのか?私は疑問を抱いている。 ただし、言っておくが、パターンマッチング≠推論、これは確かに偽命題だ。
原文表示返信0
AirdropCollectorvip
· 9時間前
ああ、つまり、パラメータを積み上げている人たちは少し道を外れたかもしれない。本当のスマートさは大きさではなく、精度にある。 この論理について考えてみると、最適化と力任せの永遠の矛盾のように感じる。面白い。 パラメータが多ければ良いアイデアが出るのか?必ずしもそうではないと思う。アーキテクチャの設計が鍵だ。 最後に誰が笑うのかを見守るだけだ。
原文表示返信0
ReverseTradingGuruvip
· 9時間前
パラメータを重ねるその罠は遅かれ早かれ失敗する、質>量ということがどうしてこんなに理解しにくいのか モデルがどんなに大きくても頭が良くても、重要なのは論理の連鎖が必要だ Sentientの連中は見抜いている、パラメータ競争に乗らずにちょっと面白いことをやっている 要するに巧妙さvs brute force、業界はまだお金をかけてパラメータを刷っているが、彼らはすでに考え方を変えている 大規模モデルのこの道はもうすぐ終わりに近づいている、次は推論能力の勝負だろう パラメータをいくら積んでもpattern matchingの本質は変わらない、この点は早く認識すべきだ 問題は、本当に考えることができる構造を誰が作り出せるのか、今後に注目だ 規模至上主義をやめて、頭を使えることが重要だ
原文表示返信0
blockBoyvip
· 9時間前
パラメータの積み重ねが王道とは限らない、私はスマートアーキテクチャの道を評価している。 --- パラメータが多ければ多いほど賢い?そんなことはない、効率が鍵だろう。 --- すべての人がGPT-Xを追い求めているわけではない、その点には賛成だ。 --- 質>量、ついに誰かが本質を言い当てた。 --- 推論 > パターンマッチング、これが違いだ。 --- 大規模モデルの道は少しずれている気がする、再考する必要がある。 --- Sentientのこの一手は良い、他がパラメータを追い求める中、彼らはアーキテクチャを追求している。 --- 全体の業界がトリリオンのパラメータに洗脳されている、少し疲れる。
原文表示返信0
DefiEngineerJackvip
· 9時間前
いや、パラメータカウントの対処は2023年のものだ。経験的に言えば、あなたはただコンピュートを壁に投げつけて、何かがくっつくことを願っているだけだ—それは最適化ではなく、ただの... 高価な brute force だ、正直なところ。非自明なパフォーマンス向上を望むなら、推論アーキテクチャは実際に重要だ。ただし、ほとんどのラボはそれを認めないだろう、なぜなら彼らはすでに規模の賭けで何十億も無駄にしているからだ、笑。
原文表示返信0
  • ピン