条新消息条新评论

登录注册

个人主页

kitkats

+关注

Ta好神秘，什么都没有留下。

注册12周年・签到1天

IP属地：浙江

芝麻信用评估

芝麻信用评分是合法独立的信用评估及信用管理机构，授权后得到分数越高，代表信用越好

就是为了让主板等周边厂商繁荣起来，有钱大家一起赚

厂商频繁更换CPU引脚和插槽，是技术原因，还是利益使然？

08-14 19:05

8g 60hz

iPhone 16系列大曝光！6大升级让你怦然心动：更大屏+人工智能

08-14 18:04

大家都有误区，其实大模型跑的快慢和 cpu 关系并不是太大。一般就是卡在内存带宽上。

哪怕是 n5105 这种机器 cpu 推理时占用都不会满。一般单通道 ddr5 用 1.5B 小模型每秒钟可以出 5 个词。使用 gpu 也是，都是卡在显存带宽上，一般看快慢就是看显存带宽。3090 和 4090 显存带宽差不多，所以吐词的速度差不多。

大模型一般来讲至少要到 30B 以上才有应用价值，一般模型用 4bit 量化以上就可以了。30B 的 4bit 量化大概就是 30x0.65=19G 上下，需要有 20 多的内存装进去。这个也基本上是 cpu 的极限了。快的 4 通道内存大概估计也会有个 10 个词每秒上下吧。

开源的不差的，但是至少要到 70B 以上的模型，qwen2 72B，llama 3.1 70B 对普通来讲就够用了。llama 3.1 405B 和 chatgpt4 感觉差不多，前者可能还稍好一点。这个可能就是要买贵点的显卡组一下了。同样的也是受限于显存带宽，慢的要命。

NAS部署llama3本地中文AI大模型，Windows NAS专属！超简单傻瓜包~电脑也可以用

08-11 15:26

qlc 理论上肯定够了，2TB 在一个周期内怎么可能用的完。

网传丨苹果弃 TLC 要用 QLC：寿命/性能更低，有望带来 2TB 版 iPhone

07-25 23:45

今天看了推送，我居然还以为自己大脑错乱了。我反复确定了一下时间，真的是 2024 年不是 2021 年。我终于放心了

重磅来袭！华为新机突然官宣：8月1日，新品正式开售！

07-25 17:52

这个是长城的贴牌的吗

史低！史低！宝马mini历史新低18.98万，但大家依旧觉得贵！！！

07-13 13:29

真的是太闲了…出风口温度虽然没有降低，但是形成的湍流打破了热边界层有可能会提升热交换的效率。建议先用仿真软件仿真一下看看

【谣言粉碎机】求求别再造谣了！简易装置堪比空调？多维度分析还原真相

07-07 23:22

#小程序://京喜/0Qdf1LjDDw0nMLt

惠寻 7号电池碱性电池 4粒

07-01 16:01

中画幅那就不是人用的机器，对焦慢的要死还会发出抽风的声音

XT50会是富士最后一个爆款么？

06-24 10:44

打赏了哈哈哈

分享我的日常，一个中年男人的EDC

06-23 05:16

<上一页
1
2
3
4
5
6
...
50
下一页>
转至页
GO

社区达人榜查看更多

1

2

冒险鼠队长

3

4

5

小提示

您确定删除该评论吗？

关注数量超出限制，
请先删除部分内容再尝试