di sinilah FastVLM berperan



mereka menempelkan MLP untuk memproyeksikan token visual dari FastViTHD ke dalam dunia LLM

hasilnya: jauh lebih sedikit token (seperti 4× lebih sedikit daripada FastViT, 16× lebih sedikit daripada ViT‑L/14 pada resolusi 336 piksel). Maksud saya, itu adalah penurunan besar dalam jumlah token dan kompleksitas, sementara
IN5.02%
MLP1.03%
PIXEL-0.88%
TOKEN0.65%
Lihat Asli
post-image
Halaman ini mungkin berisi konten pihak ketiga, yang disediakan untuk tujuan informasi saja (bukan pernyataan/jaminan) dan tidak boleh dianggap sebagai dukungan terhadap pandangannya oleh Gate, atau sebagai nasihat keuangan atau profesional. Lihat Penafian untuk detailnya.
  • Hadiah
  • 5
  • Posting ulang
  • Bagikan
Komentar
0/400
GasFeeLovervip
· 18jam yang lalu
Ya sudah, tidak ada yang perlu dibanggakan.
Lihat AsliBalas0
ser_we_are_earlyvip
· 18jam yang lalu
Tampaknya FastVLM benar-benar luar biasa ya
Lihat AsliBalas0
BlockchainBardvip
· 18jam yang lalu
Keren sekali, jumlah tokennya membuat terkejut.
Lihat AsliBalas0
WhaleWatchervip
· 18jam yang lalu
Ada hal baru lagi ya!
Lihat AsliBalas0
DiamondHandsvip
· 18jam yang lalu
Aduh, saya sedikit bingung karena ditiup...
Lihat AsliBalas0
Perdagangkan Kripto Di Mana Saja Kapan Saja
qrCode
Pindai untuk mengunduh aplikasi Gate
Komunitas
Bahasa Indonesia
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)