Kacau! Trader AI mengalami kegagalan kolektif, kehilangan sepertiga dalam 2 minggu, apakah investor ritel masih berani menyerahkan uang kepada mesin?

Question

Kecerdasan buatan sedang mengetuk pintu Wall Street, tetapi laporan pertama yang diserahkan tampak buruk seperti lokasi kecelakaan.

Serangkaian data awal dari kompetisi perdagangan terbuka menunjukkan bahwa model bahasa besar arus utama umumnya berkinerja buruk dalam perdagangan otomatis—sebagian besar sistem mengalami kerugian, frekuensi perdagangan sangat tinggi hingga tak masuk akal, dan mereka memberikan keputusan yang sangat berbeda terhadap instruksi yang sama.

Kasus paling khas berasal dari kompetisi Alpha Arena yang dioperasikan oleh startup teknologi Nof1. Mereka menempatkan delapan sistem AI terdepan seperti Claude dari Anthropic, Gemini dari Google, ChatGPT dari OpenAI, Grok dari Elon Musk, dan lainnya dalam empat babak kompetisi, setiap babak sebelum dimulai memberi masing-masing model 10.000 dolar, dan membiarkan mereka berdagang secara otomatis saham teknologi AS selama dua minggu.

Hasilnya? Portofolio keseluruhan mengalami kerugian sekitar sepertiga. Dari 32 hasil perdagangan, hanya 6 yang menguntungkan. Pendiri Nof1, Jay Azhang, secara terbuka mengatakan: “Sekarang menyerahkan uang langsung ke model besar agar mereka berdagang sendiri, jalan ini tidak akan berhasil.”

Data mengungkapkan berbagai kekurangan AI saat ini dalam skenario perdagangan. Sama-sama memberi prompt, Qwen dari Alibaba melakukan 1.418 transaksi dalam satu putaran, sementara Grok yang terbaik hanya melakukan 158 transaksi. Prestasi terbaik Grok terjadi saat ia dapat mengamati performa pesaingnya.

Blog AI Flat Circle melacak 11 arena pasar terkait, dan hasilnya menunjukkan bahwa setidaknya satu model di setiap arena menghasilkan keuntungan, tetapi hanya dua arena yang model medianya mendapatkan keuntungan—sebagian besar model tidak mampu mengalahkan pasar.

Perbedaan keputusan antar model pun semakin membuat pusing. Azhang menjelaskan bahwa dalam putaran terbaru Alpha Arena, Claude cenderung melakukan posisi long, Gemini tidak keberatan melakukan short, dan Qwen lebih suka bertaruh dengan leverage tinggi.

Kepala dana berbasis LLM yang dikelola oleh Intelligent Alpha, Doug Clinton, mengatakan: “Mereka masing-masing punya ‘kepribadian’, pengelolaannya hampir seperti mengelola seorang analis manusia.” Tetapi dengan memberi tahu model bahwa mereka memiliki bias tertentu, hasilnya bisa diperbaiki sampai batas tertentu.

Azhang menunjukkan bahwa model besar memiliki keunggulan dalam penelitian dan pemanggilan alat, tetapi di tingkat eksekusi perdagangan, kekurangannya sangat jelas: mereka tidak memahami bobot variabel seperti peringkat analis, perdagangan orang dalam, dan perubahan sentimen, sehingga mudah membeli di puncak dan menjual di dasar, serta tidak mampu mengelola posisi dengan baik.

Pengujian benchmark Intelligent Alpha memberikan referensi yang relatif positif. Mereka memberi 10 model AI akses ke dokumen keuangan, prediksi analis, catatan konferensi panggilan laporan keuangan, data makroekonomi, dan pencarian web, hanya menilai arah prediksi keuntungan. Pada kuartal keempat 2025, tingkat akurasi prediksi ChatGPT mencapai 68%, mencatat prestasi terbaik. Clinton mengatakan bahwa setiap peluncuran versi baru, performa model secara umum membaik.

Ada hambatan metodologis fundamental dalam menilai kemampuan perdagangan AI: strategi kuantitatif tradisional mengandalkan pengujian kembali data historis, tetapi hampir tidak berlaku untuk model besar—sebuah model yang ditanya tentang bagaimana bertransaksi selama pasar Maret 2020 sudah “tahu” arah tren masa lalu itu. Bias “pradiksi ke depan” ini memaksa peneliti hanya bisa melakukan evaluasi langsung di pasar nyata, sehingga berbagai arena kompetisi pun bermunculan.

Penulis blog Flat Circle, mantan co-founder perusahaan data alternatif YipitData, Jim Moran, berpendapat bahwa saat ini sebagian besar eksperimen terbuka berlangsung terlalu singkat dan terlalu banyak noise, sehingga belum cukup untuk menarik kesimpulan pasti. Arena ini juga memiliki kelemahan alami, seperti tidak mendapatkan akses ke sumber riset saham eksklusif dan kualitas eksekusi yang rendah. Ia berkata: “Jika AI agen dari arena ini langsung dipindahkan ke dalam hedge fund top, performanya seharusnya akan lebih baik.”

Mantan kepala ilmuwan data Coatue Management dan saat ini bekerja di NX1 Capital, Alexander Izydorczyk, baru-baru ini menulis bahwa tidak ada robot perdagangan AI yang menunjukkan kemampuan menghasilkan keuntungan berkelanjutan. Ia berpendapat bahwa keterbatasan arena ini terletak pada fakta bahwa data pelatihan tidak menyertakan teknik kuantitatif praktis yang digunakan oleh lembaga perdagangan rahasia.

Namun, ia meninggalkan satu penilaian yang menarik: “Pemula kadang bisa melihat sesuatu yang tidak terlihat oleh trader berpengalaman.” Ia menulis di blog pribadinya: “Ketika agen model besar benar-benar mulai berhasil dalam strategi perdagangan, kamu tidak akan langsung mendengar kabar apa-apa.”

Nof1 sedang mempersiapkan musim kedua Alpha Arena, dengan rencana memberi setiap model AI pencarian web, waktu berpikir yang lebih lama, sumber data yang lebih banyak, dan kemampuan eksekusi multi-langkah. Tetapi inti bisnis perusahaan ini adalah menyediakan alat sistem bagi trader ritel untuk membangun agen perdagangan AI—bukan langsung menempatkan AI ke posisi trading.

Posisi ini sendiri mungkin sudah menjadi penanda paling realistis tentang kemampuan perdagangan AI saat ini.

Ikuti saya: Dapatkan analisis dan wawasan pasar kripto terbaru! $BTC $ETH $SOL

#Gate广场五月交易分享 #BTC koreksi #CLARITY RUU tertunda

BTC-0,84%

ETH-2,41%

SOL0,74%

Lihat Asli

Kacau! Trader AI mengalami kegagalan kolektif, kehilangan sepertiga dalam 2 minggu, apakah investor ritel masih berani menyerahkan uang kepada mesin?

Topik Trending

GateSquareMayTradingShare

BTCPullback

IsraelStrikesIranBTCPlunges

CLARITYActStalled

CryptoStocksRally

Sematkan