exam-evaluator / assessment_engine.py
KarmanovaLidiia
Initial clean commit for HF Space (models via Git LFS)
bcb314a
# assessment_engine.py
import pandas as pd
# Импортируй твои шаги — подставь правильные модули:
# from src.data_cleaning import prepare_dataframe
# from src.features import build_baseline_features
# from src.features_q4 import add_q4_features
# from src.semantic_features import add_semantic_features
# from src.explanations import build_explanations
# from your_models_loader import load_models, predict_batch
# Заглушка: здесь покажу форму, ты подставишь свои вызовы
def run_inference_df(df: pd.DataFrame, with_explanations: bool = True) -> pd.DataFrame:
data = df.copy()
# 1) Очистка/нормализация
# data = prepare_dataframe(data)
# 2) Базовые фичи
# data = build_baseline_features(data)
# 3) Спецфичи для Q4
# data = add_q4_features(data)
# 4) Семантические фичи
# data = add_semantic_features(data)
# 5) Предсказания CatBoost по каждому вопросу
# models = load_models("models") # твоя реализация
# data = predict_batch(data, models) # должна добавить колонку predicted_score
# 6) Клип значений по диапазонам (на всякий случай)
if "question_number" in data.columns and "predicted_score" in data.columns:
def clip_score(row):
q = int(row["question_number"])
s = float(row["predicted_score"])
if q in (1, 3):
return int(min(1, max(0, round(s))))
return int(min(2, max(0, round(s))))
data["predicted_score"] = data.apply(clip_score, axis=1)
# 7) Объяснения (если есть)
# if with_explanations:
# data = build_explanations(data)
return data