Fix llama.cpp double decoding

2024-09-20 10:35:10 +02:00 · 2023-09-17 13:07:48 -07:00 · 2023-09-17 13:07:48 -07:00 · d9b0f2c9c3
commit d9b0f2c9c3
parent 230b562d53
1 changed files with 1 additions and 1 deletions
--- a/modules/llamacpp_model.py
+++ b/modules/llamacpp_model.py
@ -116,7 +116,7 @@ class LlamaCppModel:
        # Handle truncation
        prompt = self.encode(prompt)
        prompt = prompt[-get_max_prompt_length(state):]
-        prompt = self.decode(prompt).decode('utf-8')
+        prompt = self.decode(prompt)

        logit_processors = LogitsProcessorList()
        if state['ban_eos_token']: