Spaces:

tyang
/

simcse-mpnet-fuzz-tfidf

Runtime error

tyang commited on May 9, 2022

Commit

df1f528

1 Parent(s): 840d7e7

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -26,11 +26,10 @@ def thefuzz(text1, text2):
 def tfidf(text1, text2):
-    print('hello')
     t1_tfidf = vectorizer.fit_transform([text1])
     t2_tfidf = vectorizer.transform([text2])
     cosine_sim = cosine_similarity(t1_tfidf, t2_tfidf).flatten()[0]
-    return {'cosine similarity of tf-idf vectors':cosine_sim}
 def simcse(text1, text2):
@@ -39,7 +38,7 @@ def simcse(text1, text2):
     with torch.no_grad():
         embeddings = model_simcse(**inputs, output_hidden_states=True, return_dict=True).pooler_output
     cosine_sim = 1 - cosine(embeddings[0], embeddings[1])
-    return {"cosine similarity of simcse embeddings":cosine_sim}
 def mpnet(text1, text2):
@@ -48,7 +47,7 @@ def mpnet(text1, text2):
         model_output = model_mpnet(**encoded_input)
     sentence_embeddings = mean_pooling(model_output, encoded_input['attention_mask'])
     cosine_sim = 1 - cosine(sentence_embeddings[0], sentence_embeddings[1])
-    return {"cosine similarity of stsb-mpnet embeddings":cosine_sim}
 def get_scores(text1, text2):

 def tfidf(text1, text2):
     t1_tfidf = vectorizer.fit_transform([text1])
     t2_tfidf = vectorizer.transform([text2])
     cosine_sim = cosine_similarity(t1_tfidf, t2_tfidf).flatten()[0]
+    return {'cosine similarity of tf-idf vectors':str(round(cosine_sim,2))}
 def simcse(text1, text2):
     with torch.no_grad():
         embeddings = model_simcse(**inputs, output_hidden_states=True, return_dict=True).pooler_output
     cosine_sim = 1 - cosine(embeddings[0], embeddings[1])
+    return {"cosine similarity of simcse embeddings":str(round(cosine_sim,2))}
 def mpnet(text1, text2):
         model_output = model_mpnet(**encoded_input)
     sentence_embeddings = mean_pooling(model_output, encoded_input['attention_mask'])
     cosine_sim = 1 - cosine(sentence_embeddings[0], sentence_embeddings[1])
+    return {"cosine similarity of stsb-mpnet embeddings":str(round(cosine_sim,2))}
 def get_scores(text1, text2):