Фьючерсы
Сотни контрактов, рассчитанных в USDT или BTC
TradFi
Золото
Одна платформа мировых активов
Опционы
Hot
Торги опционами Vanilla в европейском стиле
Единый счет
Увеличьте эффективность вашего капитала
Демо-торговля
Начало фьючерсов
Подготовьтесь к торговле фьючерсами
Фьючерсные события
Получайте награды в событиях
Демо-торговля
Используйте виртуальные средства для торговли без риска
Запуск
CandyDrop
Собирайте конфеты, чтобы заработать аирдропы
Launchpool
Быстрый стейкинг, заработайте потенциальные новые токены
HODLer Airdrop
Удерживайте GT и получайте огромные аирдропы бесплатно
Launchpad
Будьте готовы к следующему крупному токен-проекту
Alpha Points
Торгуйте и получайте аирдропы
Фьючерсные баллы
Зарабатывайте баллы и получайте награды аирдропа
Инвестиции
Simple Earn
Зарабатывайте проценты с помощью неиспользуемых токенов
Автоинвест.
Автоинвестиции на регулярной основе.
Бивалютные инвестиции
Доход от волатильности рынка
Мягкий стейкинг
Получайте вознаграждения с помощью гибкого стейкинга
Криптозаймы
0 Fees
Заложите одну криптовалюту, чтобы занять другую
Центр кредитования
Единый центр кредитования
百度千帆深度研究 Agent登顶权威评测榜单 DeepResearch Bench
2 февраля сообщение, глубокое исследование авторитетных рейтингов интеллектуальных агентов DeepResearch Bench опубликовало последние результаты: Baidu Qianfan DeepResearch Agent (Qianfan-DeepResearch Pro) благодаря выдающимся возможностям исследования от начала до конца и высокому качеству отчетов занял первое место в рейтинге. В четырех ключевых аспектах оценки ценности исследовательских отчетов — полноте, проницательности, соблюдении инструкций и читаемости — Qianfan DeepResearch Agent достиг лидирующих позиций в отрасли.
В настоящее время DeepResearch становится ключевым разделителем в эволюции искусственного интеллекта. В отличие от традиционного генерации текста, задачи глубокого исследования требуют от системы способности самостоятельно выполнять многошаговые, итеративные когнитивные задачи, охватывающие все этапы — от понимания сложных требований и получения широкой информации до глубокого анализа и инсайтов. В настоящее время DeepResearch Agent широко применяется в академических обзорах, финансовых исследованиях, бизнес-анализе и других областях, позволяя сократить традиционные многодневные ручные исследования до минут, значительно повышая эффективность исследований и принятия решений.
В качестве «золотого стандарта» оценки возможностей этого передового направления, DeepResearch Bench заполняет пробел в оценке универсального ИИ в задачах энд-ту-энд глубокого исследования. Существующие бенчмарки в основном сосредоточены на отдельных способностях и не охватывают сложность долгосрочного рассуждения и поиска с синтезом. Этот рейтинг был разработан экспертами в области и включает 100 исследовательских задач уровня доктора, охватывающих 22 дисциплины, а также внедряет рамки оценки качества отчетов RACE и оценку точности цитирования — это самая строгая и реалистичная система оценки производительности DeepResearch Agent в мире.
Qianfan DeepResearch Agent смог выделиться в этом тестировании благодаря превосходной технической архитектуре. Он использует агентную структуру, реализуя цикл «понимание задачи — планирование — выполнение» для достижения результатов исследования от начала до конца, опираясь на поиск Baidu и технологии RAG для обеспечения широты, надежности и релевантности получения информации. Два ключевых элемента дизайна обеспечивают точность выполнения задач: во-первых, используется стратегия исследования «от общего к частному» для борьбы с неопределенностью задач; во-вторых, благодаря планированию путей глубокого выполнения и механизму рефлексии в реальном времени система может динамически оценивать прогресс и корректировать стратегию на каждом этапе, эффективно избегая галлюцинаций и отклонений от пути, обеспечивая высокое качество выполнения сложных задач.
Кроме того, на этапе генерации отчетов Qianfan DeepResearch Agent использует двухэтапный механизм рендеринга: сначала создается основной отчет (pivot), с помощью оптимизации релевантных рассуждений для обеспечения логической последовательности и полноты содержания; затем с помощью различных инструментов рендеринга на основе основного отчета формируются финальные отчеты в форматах markdown, html, ppt и других, реализуя концепцию «один раз — многоформатная доставка исследования».
В настоящее время этот DeepResearch Agent уже запущен на платформе Baidu Qianfan. Пользователи могут просто ввести сложные исследовательские требования, и система за десять минут создаст профессиональный исследовательский отчет с цитатами, что позволяет действительно реализовать «минутное» предоставление глубоких инсайтов.
Этот успех отражает мощные возможности инфраструктуры Baidu Qianfan Agent Infra. Платформа предоставляет комплексные услуги по разработке моделей, инструментов, созданию агентов, данных и среды выполнения агентов. За время работы было создано более 1,3 миллиона агентов, а среднесуточный вызов инструментов, таких как «Baidu AI Search», превысил сотни миллионов запросов.