我还真的是8个硬盘大机箱,显卡弄了个16G的跑qwen32做一些控制逻辑和json调用
要达到官网效果就直接调 api 好了。自己用32b 或者 14b,简单的推理/翻译之类还是可以的。
现在可以弄台大机箱跑nas,顺便弄个deepseek本地部署
关注数量超出限制,请先删除部分内容再尝试