NeurIPS Fast and Accurate Language Model Decoding via Parallel Token Processing

Skip to yearly menu bar Skip to main content

Oral
in
Workshop: Adaptive Foundation Models: Evolving AI for Personalized and Efficient Learning

Fast and Accurate Language Model Decoding via Parallel Token Processing

Zhepei Wei · Wei-Lin Chen · Xinyu Zhu · Yu Meng

Sat 14 Dec 2:10 p.m. PST — 2:20 p.m. PST

Abstract:

Chat is not available.