[논문] Oaken: Fast and Efficient LLM Serving with Online-Offline Hybrid …
페이지 정보
작성일25-12-31 | 조회5회관련링크
본문
학술지명 : International Symposium on Computer Architecture (ISCA'25)
제목 : Oaken: Fast and Efficient LLM Serving with Online-Offline Hybrid KV Cache Quantization
주저자 : Minsu Kim
게재일 : 2025. 6.
