理解咯。你可以再放一些prompt对比,比如我们是用“假设我原先处理一项工作需要花5个工作日,现在我开发了一些自动化工具来支持这项工作,将原先5天的工作压缩至2天,请问这里实现了百分之多少的提效”。671B能回答正确的150%,其它蒸馏模型都是60%。QwQ32B能对但是差点死循环了。
我们对比满血版和llama70B版,70B已经在思考过程明显变差了。70B再Q4量化、还几分钟出结果,真的有实际使用场景吗。。。
兄弟干得不错,我这员工都没你搞的这么清楚。不过你只梳理了“BYD”而不是“比亚迪”全家。还差腾势方程豹仰望,继续加油吧
关注数量超出限制,
请先删除部分内容再尝试