Spaces:

WildOjisan
/

python_roberta_hf

Runtime error

App Files Files Community

WildOjisan commited on Nov 10

Commit

e8a2c53

1 Parent(s): 899f482

.

Browse files

Files changed (2) hide show

.gitignore +2 -1
xtreme_distil_use.py +59 -0

.gitignore CHANGED Viewed

@@ -4,4 +4,5 @@ __pycache__/
 *.pyd
 *.log
 .venv/
-xtreme-distil-review-classifier/

 *.pyd
 *.log
 .venv/
+xtreme-distil-review-classifier/
+shopping.txt

xtreme_distil_use.py ADDED Viewed

	@@ -0,0 +1,59 @@

+import torch
+from transformers import AutoTokenizer, AutoModelForSequenceClassification
+# 1. 모델이 저장된 폴더 경로 지정
+LOAD_MODEL_PATH = "./xtreme-distil-review-classifier"
+# 2. GPU/CPU 장치 설정
+device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
+print(f"사용 장치: {device}")
+# 3. 저장된 토크나이저와 모델 로드
+# 저장된 config.json과 model.safetensors 파일을 바탕으로 로드합니다.
+print(f"\n--- 모델 로드 중: {LOAD_MODEL_PATH} ---")
+loaded_tokenizer = AutoTokenizer.from_pretrained(LOAD_MODEL_PATH)
+loaded_model = AutoModelForSequenceClassification.from_pretrained(LOAD_MODEL_PATH)
+# 모델을 설정된 장치(GPU 또는 CPU)로 이동
+loaded_model.to(device)
+loaded_model.eval() # 모델을 평가 모드로 설정 (필수)
+# 4. 분류 함수 정의
+def classify_review(text):
+    # 텍스트를 토큰화하고 장치로 이동
+    inputs = loaded_tokenizer(
+        text,
+        return_tensors="pt",  # PyTorch 텐서로 반환
+        padding=True,
+        truncation=True
+    ).to(device)
+    # 모델 추론 (Inference)
+    with torch.no_grad():
+        outputs = loaded_model(**inputs)
+    # 결과 처리
+    probabilities = torch.softmax(outputs.logits, dim=1)
+    predicted_class_id = probabilities.argmax().item()
+    # 레이블 매핑 (파인 튜닝 시 설정한 0: 부정, 1: 긍정 기준)
+    label_map = {0: "부정 (Negative)", 1: "긍정 (Positive)"}
+    predicted_label = label_map[predicted_class_id]
+    confidence = probabilities[0][predicted_class_id].item()
+    return predicted_label, confidence
+# 5. 새로운 당근마켓 리뷰 테스트 실행
+new_reviews = [
+    "매너가 정말 좋으세요! 기분 좋은 거래네요",
+    "물건 상태가 생각보다 너무 안 좋아서 속았다는 느낌이 듭니다.",
+    "빠른 거래 감사합니다. 문제 없이 잘 받았어요.",
+    "연락을 안받네요",
+]
+print("\n--- 새로운 리뷰 분류 결과 ---")
+for review in new_reviews:
+    label, confidence = classify_review(review)
+    print(f"리뷰: '{review}'")
+    print(f"  -> 예측 분류: **{label}** (확률: {confidence:.4f})")
+    print("-" * 35)