jinaai
/

xlm-roberta-flash-implementation

🇪🇺 Region: EU

Model card Files Files and versions

jupyterjazz commited on Apr 16, 2024

Commit

9db6c6f

·

verified ·

1 Parent(s): 77af1c7

Update configuration_xlm_roberta.py

Files changed (1) hide show

configuration_xlm_roberta.py +4 -1

configuration_xlm_roberta.py CHANGED Viewed

@@ -21,6 +21,7 @@ class XLMRobertaFlashConfig(PretrainedConfig):
             position_embedding_type="absolute",
             use_cache=True,
             classifier_dropout=None,
             **kwargs,
     ):
         super().__init__(pad_token_id=pad_token_id, bos_token_id=bos_token_id, eos_token_id=eos_token_id, **kwargs)
@@ -39,4 +40,6 @@ class XLMRobertaFlashConfig(PretrainedConfig):
         self.layer_norm_eps = layer_norm_eps
         self.position_embedding_type = position_embedding_type
         self.use_cache = use_cache
-        self.classifier_dropout = classifier_dropout

             position_embedding_type="absolute",
             use_cache=True,
             classifier_dropout=None,
+            use_flash_attn=True
             **kwargs,
     ):
         super().__init__(pad_token_id=pad_token_id, bos_token_id=bos_token_id, eos_token_id=eos_token_id, **kwargs)
         self.layer_norm_eps = layer_norm_eps
         self.position_embedding_type = position_embedding_type
         self.use_cache = use_cache
+        self.classifier_dropout = classifier_dropout
+        self.use_flash_attn = use_flash_attn