Spaces:

RugNlpFlashcards
/

Speech_Language_Processing_Jurafsky_Martin

Build error

Ramon Meffert commited on Mar 29, 2022

Commit

a1746cf

1 Parent(s): 6aa9059

Small fixes to retrievers

Files changed (2) hide show

src/retrievers/es_retriever.py CHANGED Viewed

@@ -5,8 +5,6 @@ from elasticsearch import Elasticsearch
 from dotenv import load_dotenv
 import os
-load_dotenv()
 logger = get_logger()
@@ -19,11 +17,14 @@ class ESRetriever(Retriever):
         es_username = os.getenv("ELASTIC_USERNAME")
         self.client = Elasticsearch(
-            hosts=[es_host], http_auth=(es_username, es_password))
         if self.client.indices.exists(index="paragraphs"):
             self.dataset.load_elasticsearch_index(
-                "paragraphs", es_index_name="paragraphs", es_client=self.client)
         else:
             logger.info(f"Creating index 'paragraphs' on {es_host}")
             self.dataset.add_elasticsearch_index(column="text",

 from dotenv import load_dotenv
 import os
 logger = get_logger()
         es_username = os.getenv("ELASTIC_USERNAME")
         self.client = Elasticsearch(
+            hosts=[es_host],
+            http_auth=(es_username, es_password),
+            ca_certs="./http_ca.crt")
         if self.client.indices.exists(index="paragraphs"):
             self.dataset.load_elasticsearch_index(
+                "paragraphs", es_index_name="paragraphs",
+                es_client=self.client)
         else:
             logger.info(f"Creating index 'paragraphs' on {es_host}")
             self.dataset.add_elasticsearch_index(column="text",

src/retrievers/faiss_retriever.py CHANGED Viewed

@@ -81,7 +81,7 @@ class FaissRetriever(Retriever):
             return index
-    def retrieve(self, query: str, k: int = 5):
         def embed(q):
             # Inline helper function to perform embedding
             tok = self.q_tokenizer(q, return_tensors="pt", truncation=True)

             return index
+    def retrieve(self, query: str, k: int = 50):
         def embed(q):
             # Inline helper function to perform embedding
             tok = self.q_tokenizer(q, return_tensors="pt", truncation=True)