File size: 1,874 Bytes
bcb314a
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
 
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
# assessment_engine.py
import pandas as pd

# Импортируй твои шаги — подставь правильные модули:
# from src.data_cleaning import prepare_dataframe
# from src.features import build_baseline_features
# from src.features_q4 import add_q4_features
# from src.semantic_features import add_semantic_features
# from src.explanations import build_explanations
# from your_models_loader import load_models, predict_batch

# Заглушка: здесь покажу форму, ты подставишь свои вызовы
def run_inference_df(df: pd.DataFrame, with_explanations: bool = True) -> pd.DataFrame:
    data = df.copy()

    # 1) Очистка/нормализация
    # data = prepare_dataframe(data)

    # 2) Базовые фичи
    # data = build_baseline_features(data)

    # 3) Спецфичи для Q4
    # data = add_q4_features(data)

    # 4) Семантические фичи
    # data = add_semantic_features(data)

    # 5) Предсказания CatBoost по каждому вопросу
    # models = load_models("models")  # твоя реализация
    # data = predict_batch(data, models)  # должна добавить колонку predicted_score

    # 6) Клип значений по диапазонам (на всякий случай)
    if "question_number" in data.columns and "predicted_score" in data.columns:
        def clip_score(row):
            q = int(row["question_number"])
            s = float(row["predicted_score"])
            if q in (1, 3):
                return int(min(1, max(0, round(s))))
            return int(min(2, max(0, round(s))))
        data["predicted_score"] = data.apply(clip_score, axis=1)

    # 7) Объяснения (если есть)
    # if with_explanations:
    #     data = build_explanations(data)

    return data