世良情感网

【[402星]llm-d:Kubernetes原生高性能分布式LLM推理框架,助

【[402星]llm-d:Kubernetes原生高性能分布式LLM推理框架,助力大规模语言模型推理部署。亮点:1. 采用vLLM优化的推理调度器,提升性能;2. 支持解耦式服务,灵活部署;3. 提供独立和共享两种KV缓存方案,优化资源利用】

'Kubernetes-Native Distributed Inference at Scale'

GitHub: github.com/llm-d/llm-d

Kubernetes 分布式推理 LLM优化 AI创造营