vllm-project · LiuXiaoxuanPKU · Jul 4, 2024 · Jul 1, 2024 · Jul 1, 2024 · Jul 1, 2024
diff --git a/vllm/model_executor/models/gemma2.py b/vllm/model_executor/models/gemma2.py
@@ -37,7 +37,8 @@
     VocabParallelEmbedding)
 from vllm.model_executor.model_loader.weight_utils import default_weight_loader
 from vllm.model_executor.sampling_metadata import SamplingMetadata
-from vllm.sequence import SamplerOutput
+from vllm.sequence import IntermediateTensors, SamplerOutput
+
 
 from .interfaces import SupportsLoRA