Spaces:

Hothaifa
/

Fatwa-hadith-assistant

Running

App Files Files Community

Hothaifa commited on Oct 1

Commit

4935ebe

verified ·

1 Parent(s): d208c4a

Update app.py

Browse files

Files changed (1) hide show

app.py +18 -25

app.py CHANGED Viewed

@@ -6,20 +6,9 @@ from dotenv import load_dotenv
 from typing import Optional
 import os
-# اجبار gdown يستخدم /tmp (المكان الوحيد المضمون بالكتابة في HuggingFace)
-cache_dir = "/tmp/gdown_cache"
-os.makedirs(cache_dir, exist_ok=True)
-gdown_cache = os.path.join(cache_dir, "gdown")
-os.makedirs(gdown_cache, exist_ok=True)
-cookie_file = os.path.join(gdown_cache, "cookies.txt")
-if not os.path.exists(cookie_file):
-    with open(cookie_file, "w") as f:
-        f.write("")
-os.environ["GDOWN_CACHE"] = cache_dir
-os.environ["XDG_CACHE_HOME"] = cache_dir
 # تحميل متغيرات البيئة
 load_dotenv()
@@ -151,10 +140,10 @@ def looks_religious_answer(text: str) -> bool:
 print("[SERVER-INFO] بدء تحميل الأصول...")
 DATA_FILE_ID = "1GMG6fVxhUuBEAHP91c8RAUdUJh5TxY5O"
 EMBEDDINGS_FILE_ID = "1MCIJ4zZRfTC9ZEy-CLvcvNbRdjTFnw5q"
-data_path = 'cleaned_fatwas_v2.csv'
-embeddings_path = 'questions_embeddings_arabert.npy'
-learned_data_path = 'learned_fatwas.csv'
-FEEDBACK_FILE = "feedback.csv"
 TELEGRAM_BOT_TOKEN = os.environ.get("TELEGRAM_BOT_TOKEN", "TOKEN")
 TELEGRAM_CHAT_ID = os.environ.get("TELEGRAM_CHAT_ID", "CHAT_ID")
@@ -256,11 +245,15 @@ def google_search_fatwa(query: str):
 # ===================== 9) FastAPI app (واحد) =====================
 app = FastAPI(title="Hajeen Islamic QA API (Fatwas + Hadith)")
 def safe_download(file_id, output_path):
-    try:
-        gdown.download(id=file_id, output=output_path, quiet=False)
         print(f"[SAFE-DOWNLOAD] تم تنزيل {output_path}")
     except Exception as e:
-        print(f"[SAFE-DOWNLOAD-ERROR] {e}")
 @app.on_event("startup")
 async def startup_event():
     global df_main, df_learned, question_embeddings, index, tokenizer, model
@@ -378,10 +371,10 @@ ID_MUSLIM  = os.environ.get("ID_MUSLIM")
 ID_MUSNAD  = os.environ.get("ID_MUSNAD")
 PATHS = {
-    "bukhari": "sahih_bukhari_clean.csv",
-    "muslim":  "sahih_muslim_clean.csv",
-    "musnad":  "musnad_ahmed_clean.csv",
-}
 # --- تطبيع عربي (أحاديث) ---
 def normalize_ar(s: str) -> str:

 from typing import Optional
 import os
+# أضف هذا السطر
+DATA_DIR = "data"
+os.makedirs(DATA_DIR, exist_ok=True)
 # تحميل متغيرات البيئة
 load_dotenv()
 print("[SERVER-INFO] بدء تحميل الأصول...")
 DATA_FILE_ID = "1GMG6fVxhUuBEAHP91c8RAUdUJh5TxY5O"
 EMBEDDINGS_FILE_ID = "1MCIJ4zZRfTC9ZEy-CLvcvNbRdjTFnw5q"
+data_path = os.path.join(DATA_DIR, 'cleaned_fatwas_v2.csv')
+embeddings_path = os.path.join(DATA_DIR, 'questions_embeddings_arabert.npy')
+learned_data_path = os.path.join(DATA_DIR, 'learned_fatwas.csv')
+FEEDBACK_FILE = os.path.join(DATA_DIR, "feedback.csv")
 TELEGRAM_BOT_TOKEN = os.environ.get("TELEGRAM_BOT_TOKEN", "TOKEN")
 TELEGRAM_CHAT_ID = os.environ.get("TELEGRAM_CHAT_ID", "CHAT_ID")
 # ===================== 9) FastAPI app (واحد) =====================
 app = FastAPI(title="Hajeen Islamic QA API (Fatwas + Hadith)")
 def safe_download(file_id, output_path):
+    try:
+        # نحدد مجلد الكاش هنا ليكون داخل مجلد البيانات الرئيسي
+        cache_folder = os.path.join(DATA_DIR, "gdown_cache")
+        gdown.download(id=file_id, output=output_path, quiet=False, cache=cache_folder)
         print(f"[SAFE-DOWNLOAD] تم تنزيل {output_path}")
     except Exception as e:
+        print(f"[SAFE-DOWNLOAD-ERROR] {e}")
+        # من الأفضل إيقاف التطبيق إذا فشل تنزيل ملف أساسي
+        raise e
 @app.on_event("startup")
 async def startup_event():
     global df_main, df_learned, question_embeddings, index, tokenizer, model
 ID_MUSNAD  = os.environ.get("ID_MUSNAD")
 PATHS = {
+    "bukhari": os.path.join(DATA_DIR, "sahih_bukhari_clean.csv"),
+    "muslim":  os.path.join(DATA_DIR, "sahih_muslim_clean.csv"),
+    "musnad":  os.path.join(DATA_DIR, "musnad_ahmed_clean.csv"),
+}
 # --- تطبيع عربي (أحاديث) ---
 def normalize_ar(s: str) -> str: