đây là nơi FastVLM xuất hiện



họ áp dụng một MLP để chiếu các token hình ảnh từ FastViTHD vào thế giới của LLM

kết quả: ít token hơn rất nhiều ( như 4× ít hơn FastViT, 16× ít hơn ViT‑L/14 ở độ phân giải 336 pixel ). Ý tôi là, đó là một sự giảm lớn về số lượng token và độ phức tạp, trong khi
IN2.73%
MLP1.44%
PIXEL4.76%
Xem bản gốc
post-image
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • 5
  • Đăng lại
  • Chia sẻ
Bình luận
0/400
GasFeeLovervip
· 8giờ trước
Cũng vậy thôi, có gì hay mà khoe.
Xem bản gốcTrả lời0
ser_we_are_earlyvip
· 8giờ trước
Có vẻ như FastVLM thật tuyệt vời.
Xem bản gốcTrả lời0
BlockchainBardvip
· 8giờ trước
Kinh ngạc quá, bị số lượng token làm choáng.
Xem bản gốcTrả lời0
WhaleWatchervip
· 8giờ trước
Lại có đồ mới nữa rồi!
Xem bản gốcTrả lời0
DiamondHandsvip
· 8giờ trước
Á á bị thổi một chút ngơ ngác...
Xem bản gốcTrả lời0
Giao dịch tiền điện tử mọi lúc mọi nơi
qrCode
Quét để tải xuống ứng dụng Gate
Cộng đồng
Tiếng Việt
  • 简体中文
  • English
  • Tiếng Việt
  • 繁體中文
  • Español
  • Русский
  • Français (Afrique)
  • Português (Portugal)
  • Bahasa Indonesia
  • 日本語
  • بالعربية
  • Українська
  • Português (Brasil)