【[402星]llm-d:Kubernetes原生高性能分布式LLM推理框架,助力大规模语言模型推理部署。亮点:1. 采用vLLM优化的推理调度器,提升性能;2. 支持解耦式服务,灵活部署;3. 提供独立和共享两种KV缓存方案,优化资源利用】
'Kubernetes-Native Distributed Inference at Scale'
GitHub: github.com/llm-d/llm-d
Kubernetes 分布式推理 LLM优化 AI创造营
【[402星]llm-d:Kubernetes原生高性能分布式LLM推理框架,助力大规模语言模型推理部署。亮点:1. 采用vLLM优化的推理调度器,提升性能;2. 支持解耦式服务,灵活部署;3. 提供独立和共享两种KV缓存方案,优化资源利用】
'Kubernetes-Native Distributed Inference at Scale'
GitHub: github.com/llm-d/llm-d
Kubernetes 分布式推理 LLM优化 AI创造营
猜你喜欢
【2评论】【22点赞】
【22评论】【26点赞】
【2评论】【1点赞】
【297评论】【66点赞】
作者最新文章
热门分类
科技TOP
科技最新文章