Model save

Files changed (10) hide show

all_results.json CHANGED Viewed

@@ -1,13 +1,13 @@
 {
     "epoch": 1.0,
-    "eval_loss": 0.9352964162826538,
-    "eval_runtime": 142.6698,
     "eval_samples": 23110,
-    "eval_samples_per_second": 108.159,
-    "eval_steps_per_second": 1.696,
-    "train_loss": 0.9776264188486502,
-    "train_runtime": 5607.0774,
     "train_samples": 207865,
-    "train_samples_per_second": 24.866,
-    "train_steps_per_second": 0.194
 }

 {
     "epoch": 1.0,
+    "eval_loss": 0.9352946281433105,
+    "eval_runtime": 142.3405,
     "eval_samples": 23110,
+    "eval_samples_per_second": 108.409,
+    "eval_steps_per_second": 1.7,
+    "train_loss": 0.07620820999145508,
+    "train_runtime": 563.6077,
     "train_samples": 207865,
+    "train_samples_per_second": 247.381,
+    "train_steps_per_second": 1.934
 }

eval_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
-    "eval_loss": 0.9352964162826538,
-    "eval_runtime": 142.6698,
     "eval_samples": 23110,
-    "eval_samples_per_second": 108.159,
-    "eval_steps_per_second": 1.696
 }

 {
     "epoch": 1.0,
+    "eval_loss": 0.9352946281433105,
+    "eval_runtime": 142.3405,
     "eval_samples": 23110,
+    "eval_samples_per_second": 108.409,
+    "eval_steps_per_second": 1.7
 }

model-00001-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:232137bac03db8babd334c175eaf9c7d7e387d1dd6f2abfbe48e207f4a443b31
 size 4943162336

 version https://git-lfs.github.com/spec/v1
+oid sha256:5ad03c68e305895320be8556507a5c7fe172be4c848b327e7154482a0e051600
 size 4943162336

model-00002-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:e4fe60091d09e1119bf778cc2369ad70d1980397bb09eecf1c58426cf6ac5903
 size 4999819336

 version https://git-lfs.github.com/spec/v1
+oid sha256:3442a9f89309cb48f3c120d06169c98cf42e0f0bb185ad262da6eaf5b65e217d
 size 4999819336

model-00003-of-00003.safetensors CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:d9636ee8013b50a24f25927cb38b16d2dc39cca8c2dad8c768b6ad96ed99cb8e
 size 4540516344

 version https://git-lfs.github.com/spec/v1
+oid sha256:6a5a61a77bbe6ccdcc60aacbb76e657e45c1a17ea23a8fd93bf7fe3ff861d5ad
 size 4540516344

runs/Jan09_00-05-47_ip-26-0-164-18/events.out.tfevents.1704758820.ip-26-0-164-18.2771624.0 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:e4a8c062eeddc8854efc1993700a0cd5e0c9e4418568d1982171c3ca73dc2408
+size 7900

runs/Jan09_00-05-47_ip-26-0-164-18/events.out.tfevents.1704759527.ip-26-0-164-18.2771624.1 ADDED Viewed

+version https://git-lfs.github.com/spec/v1
+oid sha256:bcf2610b4cfe40702a5bc0ffb88392d4d1bb991b8424589c61f2babe872475c9
+size 359

train_results.json CHANGED Viewed

@@ -1,8 +1,8 @@
 {
     "epoch": 1.0,
-    "train_loss": 0.9776264188486502,
-    "train_runtime": 5607.0774,
     "train_samples": 207865,
-    "train_samples_per_second": 24.866,
-    "train_steps_per_second": 0.194
 }

 {
     "epoch": 1.0,
+    "train_loss": 0.07620820999145508,
+    "train_runtime": 563.6077,
     "train_samples": 207865,
+    "train_samples_per_second": 247.381,
+    "train_steps_per_second": 1.934
 }

trainer_state.json CHANGED Viewed

@@ -1253,7 +1253,7 @@
     {
       "epoch": 0.95,
       "learning_rate": 1.5471558192656776e-07,
-      "loss": 0.9228,
       "step": 1035
     },
     {
@@ -1283,7 +1283,7 @@
     {
       "epoch": 0.97,
       "learning_rate": 4.6114783273213395e-08,
-      "loss": 0.9213,
       "step": 1060
     },
     {
@@ -1301,7 +1301,7 @@
     {
       "epoch": 0.99,
       "learning_rate": 1.1535349032167908e-08,
-      "loss": 0.9243,
       "step": 1075
     },
     {
@@ -1324,9 +1324,9 @@
     },
     {
       "epoch": 1.0,
-      "eval_loss": 0.9352964162826538,
-      "eval_runtime": 143.3874,
-      "eval_samples_per_second": 107.618,
       "eval_steps_per_second": 1.688,
       "step": 1090
     },
@@ -1334,10 +1334,10 @@
       "epoch": 1.0,
       "step": 1090,
       "total_flos": 456447649382400.0,
-      "train_loss": 0.9776264188486502,
-      "train_runtime": 5607.0774,
-      "train_samples_per_second": 24.866,
-      "train_steps_per_second": 0.194
     }
   ],
   "logging_steps": 5,

     {
       "epoch": 0.95,
       "learning_rate": 1.5471558192656776e-07,
+      "loss": 0.9229,
       "step": 1035
     },
     {
     {
       "epoch": 0.97,
       "learning_rate": 4.6114783273213395e-08,
+      "loss": 0.9212,
       "step": 1060
     },
     {
     {
       "epoch": 0.99,
       "learning_rate": 1.1535349032167908e-08,
+      "loss": 0.9244,
       "step": 1075
     },
     {
     },
     {
       "epoch": 1.0,
+      "eval_loss": 0.9352946281433105,
+      "eval_runtime": 143.3511,
+      "eval_samples_per_second": 107.645,
       "eval_steps_per_second": 1.688,
       "step": 1090
     },
       "epoch": 1.0,
       "step": 1090,
       "total_flos": 456447649382400.0,
+      "train_loss": 0.07620820999145508,
+      "train_runtime": 563.6077,
+      "train_samples_per_second": 247.381,
+      "train_steps_per_second": 1.934
     }
   ],
   "logging_steps": 5,

training_args.bin CHANGED Viewed

@@ -1,3 +1,3 @@
 version https://git-lfs.github.com/spec/v1
-oid sha256:bee1621f45139ee240b3b0c153fd74fc82c8acd6484b3289c3f2aae89773e166
 size 5880

 version https://git-lfs.github.com/spec/v1
+oid sha256:0dce10ff4431e31a8ad450564b20335cd289c1179f42a6c93d9b7487e35354f5
 size 5880