为什么Qwen模型总给我一种又土又low的感觉?
- 发表时间:2025-06-23 04:55:14
- 来源:
本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
推荐资讯
- 2025-06-23 10:50:1963 岁演员马景涛直播时突然晕倒、后脑勺磕地,合作方称其突发低血糖,为什么会这样?如何急救?
- 2025-06-23 10:20:17MacOS真的比Windows流畅吗?
- 2025-06-23 10:55:18国内这么多码农,为什么出不来JetBrains, MathWorks这样的公司?
- 2025-06-23 10:05:19超小团队选择Django还是Flask?
- 2025-06-23 10:20:17中国与敌国发生战争,哪些国家会帮中国?
- 2025-06-23 11:25:19为什么bilibili后端要用go来写?
- 2025-06-23 11:30:19有些家长可以恶心到什么程度?
- 2025-06-23 11:10:20人常说女人味,到底是个什么味?
- 2025-06-23 10:55:18obsidian用一两年后会有多大?全文搜索还快吗?
- 2025-06-23 11:10:20Rustaceans 掀起了 Rust 重写热潮,我们 J***aer 为何不搞个 J***a 重写热潮?
推荐产品
-
微软宣布 5 月 28 日开始下架「Microsoft 远程桌面」应用,背后原因有哪些?
咦这事和我之前参加过的讨论有关,我应该可以回答至少一部分原因 -
电视剧《繁花》中,爷叔为什么会离开宝总?
讲一个真事儿。 我有一个朋友,真的有一个朋友。 当初,他公 -
伊朗距离以色列上千公里,发射的导弹靠什么来导航定位呢?美国的GPS不会让他们用的。?
GPS靠不住,伊朗早在2015年就与中国签署了军用北斗导航技 -
能分享一下你写过的rust项目吗?
实际工作中,2020年的时候用 Rust 在 ARM 设备上
最新资讯