ViFortune-AI
/

ViT5Summer

Summarization

Safetensors

Vietnamese

Model card Files Files and versions

xet

Community

Tnt3o5 commited on Oct 2, 2025

Commit

274d479

verified ·

1 Parent(s): 4a65b37

Delete trainer_state.json

Browse files

Files changed (1) hide show

trainer_state.json +0 -159

trainer_state.json DELETED Viewed

@@ -1,159 +0,0 @@
-{
-  "best_global_step": 1000,
-  "best_metric": 0.33288311538438786,
-  "best_model_checkpoint": "./vit5-finetuned-dialogue-summarization/checkpoint-1000",
-  "epoch": 12.346749226006192,
-  "eval_steps": 200,
-  "global_step": 1000,
-  "is_hyper_param_search": false,
-  "is_local_process_zero": true,
-  "is_world_process_zero": true,
-  "log_history": [
-    {
-      "epoch": 1.2352941176470589,
-      "grad_norm": 185095.125,
-      "learning_rate": 1.3200000000000002e-05,
-      "loss": 6.2191,
-      "step": 100
-    },
-    {
-      "epoch": 2.4705882352941178,
-      "grad_norm": 158838.359375,
-      "learning_rate": 1.9943698759737188e-05,
-      "loss": 3.2303,
-      "step": 200
-    },
-    {
-      "epoch": 2.4705882352941178,
-      "eval_loss": 2.8786303997039795,
-      "eval_rouge1": 0.40996985374799266,
-      "eval_rouge2": 0.18504037812883903,
-      "eval_rougeL": 0.31774992554282866,
-      "eval_runtime": 205.398,
-      "eval_samples_per_second": 21.519,
-      "eval_steps_per_second": 0.677,
-      "step": 200
-    },
-    {
-      "epoch": 3.7058823529411766,
-      "grad_norm": 158688.46875,
-      "learning_rate": 1.9483427500783406e-05,
-      "loss": 2.9395,
-      "step": 300
-    },
-    {
-      "epoch": 4.9411764705882355,
-      "grad_norm": 190883.5,
-      "learning_rate": 1.857972171196563e-05,
-      "loss": 2.763,
-      "step": 400
-    },
-    {
-      "epoch": 4.9411764705882355,
-      "eval_loss": 2.7310757637023926,
-      "eval_rouge1": 0.42136324989901236,
-      "eval_rouge2": 0.1944821772831587,
-      "eval_rougeL": 0.3260771701642916,
-      "eval_runtime": 205.292,
-      "eval_samples_per_second": 21.53,
-      "eval_steps_per_second": 0.677,
-      "step": 400
-    },
-    {
-      "epoch": 6.173374613003096,
-      "grad_norm": 180474.46875,
-      "learning_rate": 1.7274837671572133e-05,
-      "loss": 2.6231,
-      "step": 500
-    },
-    {
-      "epoch": 7.408668730650155,
-      "grad_norm": 175110.484375,
-      "learning_rate": 1.562979030705727e-05,
-      "loss": 2.5224,
-      "step": 600
-    },
-    {
-      "epoch": 7.408668730650155,
-      "eval_loss": 2.7129697799682617,
-      "eval_rouge1": 0.43007163981326607,
-      "eval_rouge2": 0.19918326506985456,
-      "eval_rougeL": 0.3309695197898552,
-      "eval_runtime": 205.2031,
-      "eval_samples_per_second": 21.54,
-      "eval_steps_per_second": 0.677,
-      "step": 600
-    },
-    {
-      "epoch": 8.643962848297214,
-      "grad_norm": 187383.40625,
-      "learning_rate": 1.372150020484693e-05,
-      "loss": 2.4244,
-      "step": 700
-    },
-    {
-      "epoch": 9.879256965944272,
-      "grad_norm": 173576.234375,
-      "learning_rate": 1.1639196889208348e-05,
-      "loss": 2.3546,
-      "step": 800
-    },
-    {
-      "epoch": 9.879256965944272,
-      "eval_loss": 2.714728355407715,
-      "eval_rouge1": 0.4326827613393533,
-      "eval_rouge2": 0.20101319185305067,
-      "eval_rougeL": 0.3320485850425753,
-      "eval_runtime": 205.3578,
-      "eval_samples_per_second": 21.523,
-      "eval_steps_per_second": 0.677,
-      "step": 800
-    },
-    {
-      "epoch": 11.111455108359133,
-      "grad_norm": 178280.171875,
-      "learning_rate": 9.480246548866876e-06,
-      "loss": 2.2813,
-      "step": 900
-    },
-    {
-      "epoch": 12.346749226006192,
-      "grad_norm": 198161.578125,
-      "learning_rate": 7.345599302235916e-06,
-      "loss": 2.2313,
-      "step": 1000
-    },
-    {
-      "epoch": 12.346749226006192,
-      "eval_loss": 2.7374987602233887,
-      "eval_rouge1": 0.4325670867128867,
-      "eval_rouge2": 0.20087960988143622,
-      "eval_rougeL": 0.33288311538438786,
-      "eval_runtime": 205.6552,
-      "eval_samples_per_second": 21.492,
-      "eval_steps_per_second": 0.676,
-      "step": 1000
-    }
-  ],
-  "logging_steps": 100,
-  "max_steps": 1600,
-  "num_input_tokens_seen": 0,
-  "num_train_epochs": 20,
-  "save_steps": 200,
-  "stateful_callbacks": {
-    "TrainerControl": {
-      "args": {
-        "should_epoch_stop": false,
-        "should_evaluate": false,
-        "should_log": false,
-        "should_save": true,
-        "should_training_stop": false
-      },
-      "attributes": {}
-    }
-  },
-  "total_flos": 7.099476931109376e+16,
-  "train_batch_size": 32,
-  "trial_name": null,
-  "trial_params": null
-}