Yapay zeka gelişim yolları üzerine sabah düşünceleri.
Şu anda alanda ilginç bir ayrım oluşuyor. Çoğu AI laboratuvarı, parametre sayısı için bir silahlanma yarışında—daha fazla hesaplama, daha fazla veri ile giderek daha büyük modellere yönelirken—bazı projeler farklı bir bahse giriyor.
Sentient AGI'nin yaklaşımı? Onlar büyüklüğü peşinde koşmuyor. Daha akıllı bir akıl yürütme mimarisinin peşindeler. Bu klasik tartışma: kaba kuvvet mi yoksa zarif çözümler mi.
Bunu düşün—daha büyük bir beyin otomatik olarak daha iyi düşünmek mi demektir? Yoksa fikirleri ne kadar verimli bir şekilde işlediğin ve bağladığınla mı ilgili?
Endüstri, trilyonlarca parametreye sahip olan GPT-5, GPT-6 ve sonraki versiyonlarla obsesyon haline gelmiş durumda. Ama belki de gerçek atılım ölçekle değil. Belki de modelleri, sadece aşırı bir şekilde kalıp eşleştirmek yerine, gerçekten sorunları akıl yürüterek çözmeyi öğretmekte.
Bir yaklaşımın kesinlikle daha iyi olduğunu söylemiyorum. Sadece herkesin artık aynı oyunu oynamadığını belirtiyorum.
View Original
This page may contain third-party content, which is provided for information purposes only (not representations/warranties) and should not be considered as an endorsement of its views by Gate, nor as financial or professional advice. See Disclaimer for details.
10 Likes
Reward
10
5
Repost
Share
Comment
0/400
ContractHunter
· 6h ago
Parametre yığınları çoktan modası geçmiş, gerçek yarış alanı çıkarım verimliliği.
Ngl, parametre çoksa zeka yüksek demek saçmalığı kulağa çok garip geliyor...
Sentient'in bu yaklaşımı biraz şey var ama şu anda kazanmayı söylemek için henüz çok erken.
Herkes ölçek üzerinde yoğunlaşırken, sadece bu firma ince bir yol izliyor? İçinde biraz kumar unsuru var gibi.
Gerçekten mi, zarif çözüm gerçekten de kuvveti yenebilir mi? Şüpheliyim.
Ama şunu demeliyim ki, model eşleşmesi ≠ çıkarım, bu kesinlikle bir yanılsama.
View OriginalReply0
AirdropCollector
· 6h ago
Yani, parametrelerle uğraşan o grup belki de yanlış yolda. Gerçek zeka büyüklükte değil, incelikte.
Bu mantığı bir düşündüm, optimizasyon ile güç kullanımı arasındaki sonsuz çatışmaya benziyor, ilginç.
Parametrelerin çok olması iyi düşünme anlamına mı gelir? Belki de değil, bence asıl mesele mimarinin nasıl tasarlandığı.
Sonunda kimin gülümseyeceğini göreceğiz.
View OriginalReply0
ReverseTradingGuru
· 6h ago
Parametre yığma o işi er geç çöker, kalite > nicelik olgusunu anlamak bu kadar mı zor?
Model ne kadar büyük olursa olsun, mantık zinciri olmadan işe yaramaz.
Sentient bu durumu görmüş gibi, parametre rekabetine katılmaktansa farklı bir yol izliyorlar.
Açıkçası, bu ince işçilik vs. kaba kuvvet meselesi, endüstri hâlâ para harcayıp parametreleri artırırken, onlar çoktan düşüncelerini değiştirmişler.
Büyük modellerin bu yolda sona yaklaştığını hissediyorum, sonraki aşamada rekabet edilecek olan şey çıkarım yeteneği.
Parametreleri gökyüzüne kadar çıkarsanız da, pattern matching'in doğasını değiştiremezsiniz, bunu çoktan anlamış olmalısınız.
Sorun şu ki, gerçekten düşünen bir yapıyı kim yaratabilir, bunu da gelecekte göreceğiz.
O ölçek önceliği hikâyesini bırakın, yeterince akıllı olmak yeter.
View OriginalReply0
blockBoy
· 6h ago
Parametre yığınları her zaman en iyi yol değil, ben akıllı mimari yolunu destekliyorum.
---
Daha fazla parametre daha akıllı mı? Saçmalık, verimlilik anahtar değil mi?
---
Herkes GPT-X peşinde değil, bu konuda hemfikirim.
---
Kalite > miktar, nihayet biri bunu net bir şekilde söyledi.
---
reasoning > pattern matching, işte fark bu.
---
Büyük modellerin yolu yanlış yöne gidiyor gibi hissediyorum, yeniden düşünmek lazım.
---
Sentient bu hamleyi yapabilir, diğerleri parametreleri artırırken o mimariyi artırıyor.
---
Tüm çevre trilyonlarca parametreyle beyin yıkanmış durumda, biraz yorucu.
View OriginalReply0
DefiEngineerJack
· 7h ago
hayır, parametre sayısı cope 2023'ün çok ötesinde. deneysel olarak konuşursak, sadece hesaplamayı duvara fırlatıyorsun umarak bir şeyin yapışmasını—bu optimizasyon değil, bu sadece... pahalı bir kaba kuvvet, dürüst olmak gerekirse. mantıksal mimari aslında önemli eğer sıradan olmayan performans kazançları istiyorsanız. çoğu laboratuvar bunu kabul etmeyecek çünkü zaten ölçek bahisinde milyarlarca harcadılar lmao.
Yapay zeka gelişim yolları üzerine sabah düşünceleri.
Şu anda alanda ilginç bir ayrım oluşuyor. Çoğu AI laboratuvarı, parametre sayısı için bir silahlanma yarışında—daha fazla hesaplama, daha fazla veri ile giderek daha büyük modellere yönelirken—bazı projeler farklı bir bahse giriyor.
Sentient AGI'nin yaklaşımı? Onlar büyüklüğü peşinde koşmuyor. Daha akıllı bir akıl yürütme mimarisinin peşindeler. Bu klasik tartışma: kaba kuvvet mi yoksa zarif çözümler mi.
Bunu düşün—daha büyük bir beyin otomatik olarak daha iyi düşünmek mi demektir? Yoksa fikirleri ne kadar verimli bir şekilde işlediğin ve bağladığınla mı ilgili?
Endüstri, trilyonlarca parametreye sahip olan GPT-5, GPT-6 ve sonraki versiyonlarla obsesyon haline gelmiş durumda. Ama belki de gerçek atılım ölçekle değil. Belki de modelleri, sadece aşırı bir şekilde kalıp eşleştirmek yerine, gerçekten sorunları akıl yürüterek çözmeyi öğretmekte.
Bir yaklaşımın kesinlikle daha iyi olduğunu söylemiyorum. Sadece herkesin artık aynı oyunu oynamadığını belirtiyorum.