Training in progress, step 500

Browse files

Files changed (4) hide show

adapter_model.bin +1 -1
added_tokens.json +1 -7
tokenizer.json +6 -60
tokenizer_config.json +2 -2

adapter_model.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:0a0ca5aeed762080cea76c176f3eff512d27818847c9cd077ee7425f1a88d8c5
 size 1188025

 version https://git-lfs.github.com/spec/v1
+oid sha256:3a5fe54d3d01e83e66ea2edad740db9179b4f369bc72ba2d3a1ef9cb1f562192
 size 1188025

added_tokens.json CHANGED Viewed

@@ -1,13 +1,7 @@
 {
   "<ASSISTANT_TASK:>": 32771,
   "<END_TASK>": 32772,
-  "<PAD>": 32778,
   "<SYSTEM_TASK:>": 32769,
   "<USER_TASK:>": 32770,
-  "<|PAD|>": 32768,
-  "additional_special_tokens": 32777,
-  "bos_token": 32773,
-  "eos_token": 32774,
-  "pad_token": 32776,
-  "unk_token": 32775
 }

 {
   "<ASSISTANT_TASK:>": 32771,
   "<END_TASK>": 32772,
   "<SYSTEM_TASK:>": 32769,
   "<USER_TASK:>": 32770,
+  "<|PAD|>": 32768
 }

tokenizer.json CHANGED Viewed

@@ -27,57 +27,12 @@
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
-      "normalized": false,
-      "special": true
-    },
-    {
-      "id": 32770,
-      "content": "<USER_TASK:>",
-      "single_word": false,
-      "lstrip": false,
-      "rstrip": false,
-      "normalized": false,
-      "special": true
-    },
-    {
-      "id": 32771,
-      "content": "<ASSISTANT_TASK:>",
-      "single_word": false,
-      "lstrip": false,
-      "rstrip": false,
-      "normalized": false,
-      "special": true
-    },
-    {
-      "id": 32772,
-      "content": "<END_TASK>",
-      "single_word": false,
-      "lstrip": false,
-      "rstrip": false,
-      "normalized": false,
-      "special": true
-    },
-    {
-      "id": 32773,
-      "content": "bos_token",
-      "single_word": false,
-      "lstrip": false,
-      "rstrip": false,
-      "normalized": true,
-      "special": false
-    },
-    {
-      "id": 32774,
-      "content": "eos_token",
-      "single_word": false,
-      "lstrip": false,
-      "rstrip": false,
       "normalized": true,
       "special": false
     },
     {
-      "id": 32775,
-      "content": "unk_token",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
@@ -85,8 +40,8 @@
       "special": false
     },
     {
-      "id": 32776,
-      "content": "pad_token",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
@@ -94,22 +49,13 @@
       "special": false
     },
     {
-      "id": 32777,
-      "content": "additional_special_tokens",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
       "normalized": true,
       "special": false
-    },
-    {
-      "id": 32778,
-      "content": "<PAD>",
-      "single_word": false,
-      "lstrip": false,
-      "rstrip": false,
-      "normalized": false,
-      "special": true
     }
   ],
   "normalizer": null,

       "single_word": false,
       "lstrip": false,
       "rstrip": false,
       "normalized": true,
       "special": false
     },
     {
+      "id": 32770,
+      "content": "<USER_TASK:>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
       "special": false
     },
     {
+      "id": 32771,
+      "content": "<ASSISTANT_TASK:>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
       "special": false
     },
     {
+      "id": 32772,
+      "content": "<END_TASK>",
       "single_word": false,
       "lstrip": false,
       "rstrip": false,
       "normalized": true,
       "special": false
     }
   ],
   "normalizer": null,

tokenizer_config.json CHANGED Viewed

@@ -9,8 +9,8 @@
   "bos_token": "<|endoftext|>",
   "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",
-  "model_max_length": 3000,
-  "pad_token": "<PAD>",
   "tokenizer_class": "GPT2Tokenizer",
   "unk_token": "<|endoftext|>"
 }

   "bos_token": "<|endoftext|>",
   "clean_up_tokenization_spaces": true,
   "eos_token": "<|endoftext|>",
+  "model_max_length": 5000,
+  "pad_token": "<|PAD|>",
   "tokenizer_class": "GPT2Tokenizer",
   "unk_token": "<|endoftext|>"
 }