Spaces:

hugging2021
/

open-webui-rag-system

Build error

App Files Files Community

hugging2021 commited on Jul 20

Commit

36daa1c

verified ·

1 Parent(s): a6fb29f

Update rag_server.py

Browse files

Files changed (1) hide show

rag_server.py +6 -14

rag_server.py CHANGED Viewed

@@ -13,9 +13,9 @@ from transformers import AutoModel
 import streamlit as st
 # --- Konfiguration ---
 HF_API_TOKEN = os.environ.get("HF_API_TOKEN")  # Lesen Sie den Token aus der Umgebungsvariable
 MODEL_NAME = "dannyk97/mistral-screenplay-model"
-HF_CACHE_DIR = os.environ.get("HF_CACHE_DIR", "/app/cache") #Falls ein Fehler Auftritt, wird der Ordner auf /app/cache gesetzt.
 # --- Hilfsfunktionen ---
@@ -55,18 +55,10 @@ def chunk_text(text, chunk_size=500, chunk_overlap=50):
     )
     return text_splitter.split_text(text)
-# Function to create embeddings and store in FAISS
-def create_embeddings_and_store(chunks, cache_folder=HF_CACHE_DIR):
-    try:
-        embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2", cache_folder=cache_folder)
-        vector_db = FAISS.from_texts(chunks, embedding=embeddings)
-        return vector_db
-    except Exception as e:
-        print(f"❌ Fehler beim Erstellen der Embeddings: {e}")
-        print("Verwende Dummy Embeddings, um fortzufahren (Funktionen sind eingeschränkt).")
-        # Verwenden Sie eine einfachere Fallback Lösung
-        vector_db = FAISS.from_texts(["fallback text"], HuggingFaceEmbeddings(model_name="all-mpnet-base-v2", cache_folder=cache_folder))
-        return vector_db
 # Function to query the vector database and interact with Hugging Face Inference API
 def query_vector_db(query, vector_db):
@@ -116,7 +108,7 @@ for link in drive_links:
 if all_chunks:
     # Generate embeddings and store in FAISS
-    vector_db = create_embeddings_and_store(all_chunks, cache_folder=HF_CACHE_DIR)
     st.write("Embeddings Generated and Stored Successfully!")
     # User query input

 import streamlit as st
 # --- Konfiguration ---
+os.environ["HF_HOME"] = "/app/hf_cache"  # Verwenden Sie einen absoluten Pfad innerhalb des Containers und erzwingen den Cache!
 HF_API_TOKEN = os.environ.get("HF_API_TOKEN")  # Lesen Sie den Token aus der Umgebungsvariable
 MODEL_NAME = "dannyk97/mistral-screenplay-model"
 # --- Hilfsfunktionen ---
     )
     return text_splitter.split_text(text)
+def create_embeddings_and_store(chunks):
+    embeddings = HuggingFaceEmbeddings(model_name="sentence-transformers/all-MiniLM-L6-v2")
+    vector_db = FAISS.from_texts(chunks, embedding=embeddings)
+    return vector_db
 # Function to query the vector database and interact with Hugging Face Inference API
 def query_vector_db(query, vector_db):
 if all_chunks:
     # Generate embeddings and store in FAISS
+    vector_db = create_embeddings_and_store(all_chunks)
     st.write("Embeddings Generated and Stored Successfully!")
     # User query input