本来用下来对Qwen3印象不太好,但30B A3B这个惊呆了,台式机265k用cpu跑都有30多的速度,得益于Moe架构,每次只激活3b参数,压力很低,可用度非常高。
虽然经常吐槽qwen模型思考链又臭又长来刷分,但也是对比deepseek 671b版来说的,但只看开源小模型,32b模型它家之前qwq 包括这次的qwen3 32b和30b没啥好挑的了。
。
公告里的一句话看的我一身冷汗,就是这句:经家属请求,诊治医生...
伊朗人唯一的办法,就是对准特拉维夫CBD炸,反正以色列那堆破...
确诊癌症那天,我为了爽最后一次,火速包了个修车工。 男人宽...
一个个危言耸听,拿着鸡毛当令箭,像极了装在套子里的别里科夫:...
rust 的 result 是枚举,只有2个答案,要么ok要...
并不是难沟通。 第一个原因,因为技术人员长期进行技术类工作...