Vom 20.12.2025 bis 11.01.2026 ist die Universitätsbibliothek geschlossen. Ab dem 12.01.2026 gelten wieder die regulären Öffnungszeiten. Ausnahme: Medizinische Hauptbibliothek und Zentralbibliothek sind bereits ab 05.01.2026 wieder geöffnet. Weitere Informationen

Die Ergebnisse können Gästen nur in Auswahl angezeigt werden. Bitte loggen Sie sich für Vollzugriff ein: Login

Treffer: Scalable Processing-Near-Memory for 1M-Token LLM Inference: CXL-Enabled KV-Cache Management Beyond GPU Limits

Title:

Scalable Processing-Near-Memory for 1M-Token LLM Inference: CXL-Enabled KV-Cache Management Beyond GPU Limits

Authors:

Kim, Dowon, Lee, MinJae, Kim, Janghyeon, Kwon, HyuckSung, Jeong, Hyeonggyu, Park, Sang-Soo, Yoon, Minyong, Roh, Si-Dong, Kwon, Yongsuk, So, Jinin, Choi, Jungwook

Source:

2025 34th International Conference on Parallel Architectures and Compilation Techniques (PACT) PACT Parallel Architectures and Compilation Techniques (PACT), 2025 34th International Conference on. :1-13 Nov, 2025

Relation:

2025 34th International Conference on Parallel Architectures and Compilation Techniques (PACT)

Database:

IEEE Xplore Digital Library

Treffer: Scalable Processing-Near-Memory for 1M-Token LLM Inference: CXL-Enabled KV-Cache Management Beyond GPU Limits

Links

Zusatz-Funktionen