423 日 , 2025 19:45:28
313 日 , 2025 1:46:22

最近还是太忙了,还要准备计算机设计大赛,我们做的是信息可视化的赛道,后面应该会多分享一些html相关的知识。

怎么办啊,真是越来越卷了,竞赛加分还少了,保研希望渺茫,考研又得忙初试复试,真成牛马了(ノへ ̄、)

308 日 , 2025 22:16:38
307 日 , 2025 18:56:41
通义千问推理模型QwQ

通义最近开源的QwQ-32B模型在性能上已经接近DeepSeek-R1-671B模型。

QwQ-32B 在一系列基准测试中进行了评估,测试了数学推理编程能力通用能力。在数学能力的 AIME24 测评集上,以及评估代码能力的 LiveCodeBench 中,通义千问 QwQ-32B 测试表现与 DeepSeek-R1 相当,远胜于 o1-mini 及相同尺寸的 R1 后续模型。

由 Meta 首席科学家杨立昆领衔的“最难 LLMs 测评榜” LiveBench、谷歌等提出的指令遵循能力 IFEval 测试集、由加州大学伯克利分校等提出的评估调用函数或工具方面的 BFCL 测试中,QwQ-32B 的得分均超越了 DeepSeek- R1。

大家可以在Hifox阿里云百炼或者SiliconCloud中体验模型,或者自己在ollama中本地部署

  1. kevin 博主 : https://modelscope.cn/models/Qwen/QwQ-32B 这里也能通过调用api来体验模型
305 日 , 2025 21:27:21