Результаты поиска для "QWEN"
13:10

Цзинвэй Хэнжун: Компания развернула DeepSeek и Qwen

Jingwei Hengrun использует большие модели, такие как DeepSeek и Qwen, для разработки профессиональных приложений искусственного интеллекта, охватывающих множество областей, таких как интеллектуальная помощь, проектирование, тестирование, оптимизация продуктов и аналитика бизнес-процессов. Эти приложения повышают эффективность и качество работы и снижают затраты.
Больше
  • 3
  • 1
23:02
Информационное агентство Jinse сообщает, что команда Али Qwen официально представила свои последние исследовательские результаты - крупнейшую языковую модель QwQ-32B, которая с помощью обучения с подкреплением достигла прорыва в производительности при объеме параметров всего лишь 1/21 DeepSeek-R1.
  • 1
  • 2
12:16

Четвертый парадигмы запускает решение для краевого вывода крупных моделей ModelHub AIoT

26 февраля Golden Ten Data узнала от 4Paradigm, что 4Paradigm запустила ModelHub AIoT, конечное решение для вывода крупномасштабных моделей, которое позволяет пользователям легко развертывать малогабаритные модели дистилляции, включая DeepSeek R1, Qwen 2.5, серию Llama 2/3 и т. д., на стороне устройства и осуществлять автономную работу. Пользователи могут гибко переключаться между несколькими моделями, принимая во внимание производительность сжатия и вывода моделей, а также решая сложность развертывания и оптимизации. По словам компании, это решение может не только удовлетворить потребности пользователей в конфиденциальности и режиме реального времени, но и значительно снизить стоимость вывода больших моделей ИИ.
Больше
04:11

Команда Qwen от Alibaba представляет новую модель QwQ, которая покажет полную цепочку мыслей

Данные Jinshi 25 февраля сообщают, что команда Qwen Alibaba сегодня утром объявила в социальных сетях о выпуске новой модели вывода - Глубокое мышление (QwQ). Это модель вывода, основанная на Qwen2.5-Max, поддерживаемая QWQ-MAX-PREVIEW. Blue Whale News обнаружила, что аналогично DeepSeek
Больше
MAX0.91%
  • 2
  • 1
03:59
Согласно отчету TechWeb от 19 сентября, отечественная авторитетная система оценки Flag_ (Libra) объявила результаты оценки последних крупных моделей из сентябрьского списка. Основываясь на последнем наборе данных субъективной оценки CLCC v2.0, сентябрьский список Flag_ (Libra) фокусируется на оценке 7 моделей диалога с открытым исходным кодом, которые в последнее время стали популярными. Судя по общим результатам, b-chat Baichuan2-13, b-chat Qwen-7 и b-chat Baichuan2-7 являются одними из лучших, их точность превышает 65%. В списке базовых моделей результаты объективной оценки Baichuan 2, Qwen, InternLM и Aquila превзошли модели Llama и Llama2 того же уровня параметров. В списке моделей SFT Baichuan 2-13 B-chat, YuLan-Chat-2-13 B и AquilaChat-7 B входят в тройку лидеров. В обоих списках объективной оценки Baichuan 2 показал отличные характеристики, а базовая модель превзошла Llama 2 как в китайском, так и в английском полях. Сообщается, что Flag_ (Весы) — это крупная система оценки моделей и открытая платформа, запущенная Пекинским научно-исследовательским институтом искусственного интеллекта Чжиюань. Она направлена на создание научных, справедливых и открытых критериев оценки, методов и наборов инструментов, которые помогут исследователям во всесторонней оценке базовых моделей и Производительность алгоритмов обучения. Флаг_ Система оценки большой языковой модели в настоящее время включает 6 основных задач оценки, около 30 наборов данных оценки и более 100 000 вопросов оценки.
03:14
По данным Kechuangban Daily, Alibaba Cloud сегодня запустила крупномасштабную модель визуального языка Qwen-VL и открыла ее исходный код напрямую. Qwen-VL разработан на основе модели Qwen-7B с 7 миллиардами параметров Тонги Цяньвэня, которая поддерживает графический и текстовый ввод. По сравнению с предыдущей моделью VL, Qwen-VL не только имеет базовые возможности распознавания изображения и текста, описания, вопросов и ответов и диалога, но также добавляет новые возможности, такие как визуальное позиционирование и понимание текста на изображениях, которые можно использовать для знания, ответы на вопросы и создание подписей к изображениям, вопросы и ответы по изображениям, вопросы и ответы по документам, детальное визуальное позиционирование и другие сценарии.
13:33
Jinse Finance сообщила, что технологический гигант Alibaba Group объявил 3 августа, что его подразделение облачных вычислений выпустило две модели искусственного интеллекта (ИИ) с открытым исходным кодом. Его две большие языковые модели (LLM) называются Qwen-7B и Qwen-7B-Chat, каждая из которых имеет 7 миллиардов параметров. Новая модель призвана помочь внедрить искусственный интеллект в деятельность малого и среднего бизнеса. Qwen-7B и Qwen-7B-Chat обладают различными функциями, привлекательными для предприятий, такими как предоставление «бесплатного доступа к коду, весам моделей и документации для ученых, исследователей и коммерческих организаций по всему миру», говорится в сообщении компании. 1 августа компания также объявила об обновлении векторного движка для своей службы хранилища данных AnalyticDB, которая позволит ее корпоративным клиентам быстро создавать собственные генеративные приложения искусственного интеллекта.
06:45
Согласно отчетам 36 Krypton, 3 августа Alibaba Cloud открыла исходный код модели Tongyi Qianwen с 7 миллиардами параметров, включая общую модель Qwen-7 B и диалоговую модель Qwen-7 B-Chat, бесплатно и коммерчески доступную. Этот шаг делает Alibaba Cloud первой крупной технологической компанией в Китае, присоединившейся к числу крупных компаний с открытым исходным кодом.
Загрузить больше

Популярные темы

Больше

Крипто-календарь

Больше
Основные события
SOL Strategies начнет торговать обыкновенными акциями на Nasdaq Global Select Market с 9 сентября, тикер STKE.
2025-09-09
Разблокировка токенов
Sonic (S) разблокирует 150 миллионов Токенов 9 сентября в 8:00, стоимость которых составляет около 4568 миллионов долларов, что составляет 5,02% от Оборотного предложения.
2025-09-09
Разблокировка токенов
Movement(MOVE)разблокирует 50 миллионов токенов 9 сентября в 20:00, стоимостью около 5,94 миллиона долларов, что составляет 1,89% от оборотного предложения.
2025-09-09
Хакатон
Arbitrum запускает трехнедельный онлайн-билдатор Open House India, который включает в себя мастер-классы, панельные дискуссии, сессии AMA, практику презентаций и конкурс на создание проектов. Программа открывается 22 августа с начального стрима, за которым следует панельная дискуссия о глобальном строительстве из Индии и сессия по скоростным знакомствам для разработчиков в Discord. В расписании: инструменты и ввод в Solidity, прокси-шаблоны с экспертами сообщества, шахматы в блокчейне на Rust через Stylus, распространенные ошибки безопасности смарт-контрактов, проектирование токенов с гостем из Ethereum Foundation и три раунда "дружеских презентаций" 29 августа, 3 сентября и 5 сентября. Победители будут объявлены 10 сентября на праздновании Proof-of-Build.
2025-09-09
Запуск "Facade" Гэвина Мийлера
SuperRare представит "Facade", новую коллекцию художника Гэвина Мийлера, начиная с 10 сентября. Падение включает три уникальные работы 1/1 — On the Brink, Unraveled и The Glare — каждая с резервной ценой 1.5 ETH. Выразительные, абстрактные произведения будут доступны на рынке искусства в блокчейне в течение ограниченного периода торгов.
2025-09-09