本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
我用Flutter开发了一款双因素身份验证器,它叫Cloud...
2025-06-24阅读全文 >>韦东奕是个悲剧,是我们这个时代应试教育和家庭环境合力打磨出的...
2025-06-24阅读全文 >>Cursor在短短一年内负载增长了100倍,数据层每秒处理超...
2025-06-24阅读全文 >>我试过这种操作,家里养了一条拉布拉多,有一次我洗完澡忘了拿衣...
2025-06-24阅读全文 >>当年做游戏开发,C++、Lua、J***aScript、Ty...
2025-06-24阅读全文 >>