Новости Gate: Последние новости криптовалют и цены на криптовалюты

13:10

Цзинвэй Хэнжун: Компания развернула DeepSeek и Qwen

Jingwei Hengrun использует большие модели, такие как DeepSeek и Qwen, для разработки профессиональных приложений искусственного интеллекта, охватывающих множество областей, таких как интеллектуальная помощь, проектирование, тестирование, оптимизация продуктов и аналитика бизнес-процессов. Эти приложения повышают эффективность и качество работы и снижают затраты.

Больше

DEEPSEEK-5.32%

23:02

Информационное агентство Jinse сообщает, что команда Али Qwen официально представила свои последние исследовательские результаты - крупнейшую языковую модель QwQ-32B, которая с помощью обучения с подкреплением достигла прорыва в производительности при объеме параметров всего лишь 1/21 DeepSeek-R1.

DEEPSEEK-5.32%

12:16

Четвертый парадигмы запускает решение для краевого вывода крупных моделей ModelHub AIoT

26 февраля Golden Ten Data узнала от 4Paradigm, что 4Paradigm запустила ModelHub AIoT, конечное решение для вывода крупномасштабных моделей, которое позволяет пользователям легко развертывать малогабаритные модели дистилляции, включая DeepSeek R1, Qwen 2.5, серию Llama 2/3 и т. д., на стороне устройства и осуществлять автономную работу. Пользователи могут гибко переключаться между несколькими моделями, принимая во внимание производительность сжатия и вывода моделей, а также решая сложность развертывания и оптимизации. По словам компании, это решение может не только удовлетворить потребности пользователей в конфиденциальности и режиме реального времени, но и значительно снизить стоимость вывода больших моделей ИИ.

Больше

DEEPSEEK-5.32%

04:11

Команда Qwen от Alibaba представляет новую модель QwQ, которая покажет полную цепочку мыслей

Данные Jinshi 25 февраля сообщают, что команда Qwen Alibaba сегодня утром объявила в социальных сетях о выпуске новой модели вывода - Глубокое мышление (QwQ). Это модель вывода, основанная на Qwen2.5-Max, поддерживаемая QWQ-MAX-PREVIEW. Blue Whale News обнаружила, что аналогично DeepSeek

Больше

DEEPSEEK-5.32%

03:59

Согласно отчету TechWeb от 19 сентября, отечественная авторитетная система оценки Flag_ (Libra) объявила результаты оценки последних крупных моделей из сентябрьского списка. Основываясь на последнем наборе данных субъективной оценки CLCC v2.0, сентябрьский список Flag_ (Libra) фокусируется на оценке 7 моделей диалога с открытым исходным кодом, которые в последнее время стали популярными. Судя по общим результатам, b-chat Baichuan2-13, b-chat Qwen-7 и b-chat Baichuan2-7 являются одними из лучших, их точность превышает 65%. В списке базовых моделей результаты объективной оценки Baichuan 2, Qwen, InternLM и Aquila превзошли модели Llama и Llama2 того же уровня параметров. В списке моделей SFT Baichuan 2-13 B-chat, YuLan-Chat-2-13 B и AquilaChat-7 B входят в тройку лидеров. В обоих списках объективной оценки Baichuan 2 показал отличные характеристики, а базовая модель превзошла Llama 2 как в китайском, так и в английском полях. Сообщается, что Flag_ (Весы) — это крупная система оценки моделей и открытая платформа, запущенная Пекинским научно-исследовательским институтом искусственного интеллекта Чжиюань. Она направлена на создание научных, справедливых и открытых критериев оценки, методов и наборов инструментов, которые помогут исследователям во всесторонней оценке базовых моделей и Производительность алгоритмов обучения. Флаг_ Система оценки большой языковой модели в настоящее время включает 6 основных задач оценки, около 30 наборов данных оценки и более 100 000 вопросов оценки.

03:14

По данным Kechuangban Daily, Alibaba Cloud сегодня запустила крупномасштабную модель визуального языка Qwen-VL и открыла ее исходный код напрямую. Qwen-VL разработан на основе модели Qwen-7B с 7 миллиардами параметров Тонги Цяньвэня, которая поддерживает графический и текстовый ввод. По сравнению с предыдущей моделью VL, Qwen-VL не только имеет базовые возможности распознавания изображения и текста, описания, вопросов и ответов и диалога, но также добавляет новые возможности, такие как визуальное позиционирование и понимание текста на изображениях, которые можно использовать для знания, ответы на вопросы и создание подписей к изображениям, вопросы и ответы по изображениям, вопросы и ответы по документам, детальное визуальное позиционирование и другие сценарии.

13:33

Jinse Finance сообщила, что технологический гигант Alibaba Group объявил 3 августа, что его подразделение облачных вычислений выпустило две модели искусственного интеллекта (ИИ) с открытым исходным кодом. Его две большие языковые модели (LLM) называются Qwen-7B и Qwen-7B-Chat, каждая из которых имеет 7 миллиардов параметров. Новая модель призвана помочь внедрить искусственный интеллект в деятельность малого и среднего бизнеса. Qwen-7B и Qwen-7B-Chat обладают различными функциями, привлекательными для предприятий, такими как предоставление «бесплатного доступа к коду, весам моделей и документации для ученых, исследователей и коммерческих организаций по всему миру», говорится в сообщении компании. 1 августа компания также объявила об обновлении векторного движка для своей службы хранилища данных AnalyticDB, которая позволит ее корпоративным клиентам быстро создавать собственные генеративные приложения искусственного интеллекта.

06:45

Согласно отчетам 36 Krypton, 3 августа Alibaba Cloud открыла исходный код модели Tongyi Qianwen с 7 миллиардами параметров, включая общую модель Qwen-7 B и диалоговую модель Qwen-7 B-Chat, бесплатно и коммерчески доступную. Этот шаг делает Alibaba Cloud первой крупной технологической компанией в Китае, присоединившейся к числу крупных компаний с открытым исходным кодом.

Цзинвэй Хэнжун: Компания развернула DeepSeek и Qwen

Четвертый парадигмы запускает решение для краевого вывода крупных моделей ModelHub AIoT

Команда Qwen от Alibaba представляет новую модель QwQ, которая покажет полную цепочку мыслей

Популярные темы

Крипто-календарь