kt为了减少显存占用,gpu只加载了6个专家模型,其它的模型放在内存,大幅降低了硬件要求,还能有一个可观的tokens
512gb可以跑671Bq4了
r1不可能吧,你跑的哪个模型?
382gb只是最低要求,上下文跑几个问题内存就爆了,要512gb内存才能跑的动,这已经跟绝大部分人无缘了
ollama支持cpu和gpu混合推理,但是据我部署的671B大模型跑推理来看实际上gpu负载0-3%,模型太大了,显存没大到一定程度,gpu已经不参与运算了,都是CPU再跑。
没找到50元的210,分享一下哪家买的?
和switch的兼容性怎么样?
49-10在哪里领?
7折券在哪里领?
无货
您确定删除该评论吗?
关注数量超出限制,请先删除部分内容再尝试