世良情感网

M3 Ultra跑DeepSeek-R1满血版(671B)量化的LLM,单跑gg

M3 Ultra跑DeepSeek-R1满血版(671B)量化的LLM,单跑gguf就有15.78Tokens/s,跑MLX更有20Tokens/s...

苹果芯片的Ultra,依然很Ultra[裂开] ​​​