Fix NTK (alpha) and RoPE scaling for exllamav2 and exllamav2_HF (#3897)

2024-09-20 10:35:10 +02:00 · 2023-09-13 02:35:09 -03:00 · 2023-09-13 02:35:09 -03:00 · 34dc7306b8
commit 34dc7306b8
parent eb9ebabec7
2 changed files with 5 additions and 5 deletions
--- a/modules/exllamav2.py
+++ b/modules/exllamav2.py
@ -28,9 +28,9 @@ class Exllamav2Model:
        config.prepare()

        config.max_seq_len = shared.args.max_seq_len
-        config.rope_scale = shared.args.compress_pos_emb
-        config.rope_alpha = shared.args.alpha_value
-
+        config.scale_pos_emb = shared.args.compress_pos_emb
+        config.scale_alpha_value = shared.args.alpha_value
+        
        model = ExLlamaV2(config)

        split = None
--- a/modules/exllamav2_hf.py
+++ b/modules/exllamav2_hf.py
@ -116,7 +116,7 @@ class Exllamav2HF(PreTrainedModel):
        config.prepare()

        config.max_seq_len = shared.args.max_seq_len
-        config.rope_scale = shared.args.compress_pos_emb
-        config.rope_alpha = shared.args.alpha_value
+        config.scale_pos_emb = shared.args.compress_pos_emb
+        config.scale_alpha_value = shared.args.alpha_value

        return Exllamav2HF(config)