Spaces:

LLDDWW
/

MedCard

Running

App Files Files Community

LLDDWW commited on Oct 13

Commit

7a2cdb5

1 Parent(s): 63c2769

Switch OCR engine to PaddleOCR

Browse files

Files changed (1) hide show

app.py +10 -10

app.py CHANGED Viewed

@@ -10,7 +10,7 @@ import torch
 from PIL import Image
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from huggingface_hub import login
-import easyocr
 # Hugging Face 토큰으로 로그인 (Spaces Secret에서 가져옴)
 HF_TOKEN = os.getenv("HF_TOKEN")
@@ -30,9 +30,9 @@ def load_models():
     global OCR_READER, MED_MODEL, MED_TOKENIZER
     if OCR_READER is None:
-        print("🔄 Loading EasyOCR (Korean + English)...")
-        OCR_READER = easyocr.Reader(['ko', 'en'], gpu=True)
-        print("✅ EasyOCR loaded!")
     if MED_MODEL is None:
         print("🔄 Loading Gemma-2-2B for medical analysis (8bit quantization)...")
@@ -71,19 +71,19 @@ def analyze_medication_image(image: Image.Image) -> Tuple[str, str]:
     """이미지에서 OCR 추출 후 약 정보 분석"""
     import time
     try:
-        # Step 1: OCR - EasyOCR로 빠르게 텍스트 추출
         start_time = time.time()
         img_array = np.array(image)
-        ocr_results = OCR_READER.readtext(img_array)
         ocr_time = time.time() - start_time
         print(f"⏱️ OCR took {ocr_time:.2f}s")
-        if not ocr_results:
             return "텍스트를 찾을 수 없습니다.", ""
-        # 텍스트 추출 (신뢰도 순으로 정렬)
-        ocr_results_sorted = sorted(ocr_results, key=lambda x: x[1], reverse=True)
-        ocr_text = "\n".join([text for _, text, _ in ocr_results])
         # Step 2: 약 정보 분석 - MedGemma로 의료 정보 제공
         analysis_start = time.time()

 from PIL import Image
 from transformers import AutoTokenizer, AutoModelForCausalLM
 from huggingface_hub import login
+from paddleocr import PaddleOCR
 # Hugging Face 토큰으로 로그인 (Spaces Secret에서 가져옴)
 HF_TOKEN = os.getenv("HF_TOKEN")
     global OCR_READER, MED_MODEL, MED_TOKENIZER
     if OCR_READER is None:
+        print("🔄 Loading PaddleOCR (Korean)...")
+        OCR_READER = PaddleOCR(lang='korean', use_angle_cls=True, show_log=False)
+        print("✅ PaddleOCR loaded!")
     if MED_MODEL is None:
         print("🔄 Loading Gemma-2-2B for medical analysis (8bit quantization)...")
     """이미지에서 OCR 추출 후 약 정보 분석"""
     import time
     try:
+        # Step 1: OCR - PaddleOCR로 한글 텍스트 추출
         start_time = time.time()
         img_array = np.array(image)
+        ocr_results = OCR_READER.ocr(img_array, cls=True)
         ocr_time = time.time() - start_time
         print(f"⏱️ OCR took {ocr_time:.2f}s")
+        if not ocr_results or not ocr_results[0]:
             return "텍스트를 찾을 수 없습니다.", ""
+        # 텍스트 추출
+        texts = [line[1][0] for line in ocr_results[0]]
+        ocr_text = "\n".join(texts)
         # Step 2: 약 정보 분석 - MedGemma로 의료 정보 제공
         analysis_start = time.time()