Spaces:

kambris
/

SoLProject

Runtime error

kambris commited on Dec 6, 2024

Commit

f62fb31

verified ·

1 Parent(s): e480aa0

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -239,24 +239,20 @@ def get_embedding_for_text(text, tokenizer, model):
     chunk_embeddings = []
     for chunk in chunks:
-        try:
-            inputs = tokenizer(
-                chunk,
-                return_tensors="pt",
-                padding=True,
-                truncation=True,
-                max_length=512
-            )
-            inputs = {k: v.to(model.device) for k, v in inputs.items()}
-            with torch.no_grad():
-                outputs = model(**inputs)
-            embedding = outputs.last_hidden_state[:, 0, :].cpu().numpy()
             chunk_embeddings.append(embedding[0])
-        except Exception as e:
-            st.warning(f"Error processing chunk: {str(e)}")
-            continue
     if chunk_embeddings:
         weights = np.array([len(chunk.split()) for chunk in chunks])

     chunk_embeddings = []
     for chunk in chunks:
+        inputs = tokenizer(
+            chunk,
+            return_tensors="pt",
+            padding=True,
+            truncation=True,
+            max_length=512
+        )
+        inputs = {k: v.to(model.device) for k, v in inputs.items()}
+        with torch.no_grad():
+            # Access the first element of the tuple which contains the hidden states
+            outputs = model(**inputs)[0]
+            embedding = outputs[:, 0, :].cpu().numpy()
             chunk_embeddings.append(embedding[0])
     if chunk_embeddings:
         weights = np.array([len(chunk.split()) for chunk in chunks])