Spaces:

RugNlpFlashcards
/

Speech_Language_Processing_Jurafsky_Martin

Build error

Robert commited on Mar 14, 2022

Commit

8fe5a80

1 Parent(s): 2827202

Small calculation fixes. Current exact match: 0.02, F1-score: 0.12

Files changed (2) hide show

base_model/main.py CHANGED Viewed

@@ -15,6 +15,6 @@ if __name__ == '__main__':
         print()  # Newline
     # Compute overall performance
-    exact_match, f1_score, total = r.evaluate()
-    print(f"Exact match: {exact_match} / {total}\n"
           f"F1-score: {f1_score:.02f}")

         print()  # Newline
     # Compute overall performance
+    exact_match, f1_score = r.evaluate()
+    print(f"Exact match: {exact_match:.02f}\n"
           f"F1-score: {f1_score:.02f}")

base_model/retriever.py CHANGED Viewed

@@ -7,7 +7,6 @@ from transformers import (
 from datasets import load_dataset
 import torch
 import os.path
-import numpy
 import evaluate
@@ -125,9 +124,8 @@ class Retriever:
         entire dataset.
         Returns:
-            int: overall exact match
             float: overall F1-score
-            int: total amount of questions handled
         """
         questions_ds = load_dataset("GroNLP/ik-nlp-22_slp", name="questions")['test']
         questions = questions_ds['question']
@@ -142,7 +140,7 @@ class Retriever:
             scores += score[0]
             predictions.append(result['text'][0])
-        exact_match = max((evaluate.compute_exact_match(predictions[i], answers[i])) for i in range(len(answers)))
-        f1_score = max((evaluate.compute_f1(predictions[i], answers[i])) for i in range(len(answers)))
-        return exact_match, f1_score, len(answers)

 from datasets import load_dataset
 import torch
 import os.path
 import evaluate
         entire dataset.
         Returns:
+            float: overall exact match
             float: overall F1-score
         """
         questions_ds = load_dataset("GroNLP/ik-nlp-22_slp", name="questions")['test']
         questions = questions_ds['question']
             scores += score[0]
             predictions.append(result['text'][0])
+        exact_matches = [evaluate.compute_exact_match(predictions[i], answers[i]) for i in range(len(answers))]
+        f1_scores = [evaluate.compute_f1(predictions[i], answers[i]) for i in range(len(answers))]
+        return sum(exact_matches) / len(exact_matches), sum(f1_scores) / len(f1_scores)