通义千问推理模型QwQ – kevinの小破站

公告

记录自己技术增长过程的博客~

站点概览
功能

kevin

痴迷学习，无法自拔

Github

备用站点

3 月 07 日 , 2025

|

18:56:41

通义千问推理模型QwQ

通义最近开源的QwQ-32B模型在性能上已经接近DeepSeek-R1-671B模型。

QwQ-32B 在一系列基准测试中进行了评估，测试了数学推理、编程能力和通用能力。在数学能力的 AIME24 测评集上，以及评估代码能力的 LiveCodeBench 中，通义千问 QwQ-32B 测试表现与 DeepSeek-R1 相当，远胜于 o1-mini 及相同尺寸的 R1 后续模型。

由 Meta 首席科学家杨立昆领衔的“最难 LLMs 测评榜” LiveBench、谷歌等提出的指令遵循能力 IFEval 测试集、由加州大学伯克利分校等提出的评估调用函数或工具方面的 BFCL 测试中，QwQ-32B 的得分均超越了 DeepSeek- R1。

大家可以在Hifox、阿里云百炼或者SiliconCloud中体验模型，或者自己在ollama中本地部署

评论

kevin
博主
Windows Edge

3 月前
2025-3-07 19:17:05

https://modelscope.cn/models/Qwen/QwQ-32B
这里也能通过调用api来体验模型

发送评论编辑评论

Markdown

悄悄话

邮件提醒

|´・ω・)ノ

ヾ(≧∇≦*)ゝ

(☆ω☆)

（╯‵□′）╯︵┴─┴

￣﹃￣

(/ω＼)

∠( ᐛ 」∠)＿

(๑•̀ㅁ•́ฅ)

→_→

୧(๑•̀⌄•́๑)૭

٩(ˊᗜˋ*)و

(ノ°ο°)ノ

(´இ皿இ｀)

⌇●﹏●⌇

(ฅ´ω`ฅ)

(╯°A°)╯︵○○○

φ(￣∇￣o)

ヾ(´･･｀｡)ノ"

( ง ᵒ̌皿ᵒ̌)ง⁼³₌₃

(ó﹏ò｡)

Σ(っ °Д °;)っ

( ,,´･ω･)ﾉ"(´っω･｀｡)

╮(╯▽╰)╭

o(*////▽////*)q

＞﹏＜

( ๑´•ω•) "(ㆆᴗㆆ)

颜文字

Emoji

小恐龙

花!