Spaces:

ttzzs
/

chronos2-excel-forecasting-api

Build error

App Files Files Community

ttzzs commited on Nov 8

Commit

19c8775

verified ·

1 Parent(s): 9fb828f

Fix: Use local model loading (HF Inference API doesn't support Chronos)

Browse files

Files changed (2) hide show

app/main.py +529 -281
requirements.txt +2 -2

app/main.py CHANGED Viewed

@@ -1,395 +1,643 @@
 import os
 from typing import List, Dict, Optional
-import json
 import numpy as np
 import pandas as pd
 from fastapi import FastAPI, HTTPException
 from fastapi.middleware.cors import CORSMiddleware
 from pydantic import BaseModel, Field
-from huggingface_hub import InferenceClient
 # =========================
-# Configuración
 # =========================
-HF_TOKEN = os.getenv("HF_TOKEN")
-MODEL_ID = os.getenv("CHRONOS_MODEL_ID", "amazon/chronos-t5-large")
 app = FastAPI(
-    title="Chronos-2 Forecasting API (HF Inference)",
     description=(
-        "API de pronósticos usando Chronos-2 via Hugging Face Inference API. "
-        "Compatible con Excel Add-in."
     ),
     version="1.0.0",
 )
-# Configurar CORS
 app.add_middleware(
     CORSMiddleware,
-    allow_origins=["*"],  # En producción, especificar dominios permitidos
     allow_credentials=True,
     allow_methods=["*"],
     allow_headers=["*"],
 )
-# Cliente de HF Inference
-if not HF_TOKEN:
-    print("⚠️  WARNING: HF_TOKEN no configurado. La API puede no funcionar correctamente.")
-    print("   Configura HF_TOKEN en las variables de entorno del Space.")
-    client = None
-else:
-    client = InferenceClient(token=HF_TOKEN)
 # =========================
-# Modelos Pydantic
 # =========================
 class UnivariateSeries(BaseModel):
     values: List[float]
-class ForecastUnivariateRequest(BaseModel):
-    series: UnivariateSeries
-    prediction_length: int = Field(7, description="Número de pasos a predecir")
-    quantile_levels: Optional[List[float]] = Field(
-        default=[0.1, 0.5, 0.9],
-        description="Cuantiles para intervalos de confianza"
     )
-    freq: str = Field("D", description="Frecuencia temporal (D, W, M, etc.)")
 class ForecastUnivariateResponse(BaseModel):
     timestamps: List[str]
     median: List[float]
-    quantiles: Dict[str, List[float]]
-class AnomalyDetectionRequest(BaseModel):
-    context: UnivariateSeries
-    recent_observed: List[float]
-    prediction_length: int = 7
-    quantile_low: float = 0.05
-    quantile_high: float = 0.95
-class AnomalyPoint(BaseModel):
-    index: int
-    value: float
-    predicted_median: float
-    lower: float
-    upper: float
-    is_anomaly: bool
-class AnomalyDetectionResponse(BaseModel):
-    anomalies: List[AnomalyPoint]
-class BacktestRequest(BaseModel):
-    series: UnivariateSeries
-    prediction_length: int = 7
-    test_length: int = 28
-class BacktestMetrics(BaseModel):
-    mae: float
-    mape: float
-    rmse: float
-class BacktestResponse(BaseModel):
-    metrics: BacktestMetrics
-    forecast_median: List[float]
-    forecast_timestamps: List[str]
-    actuals: List[float]
-# =========================
-# Función auxiliar para llamar a HF Inference
-# =========================
-def call_chronos_inference(series: List[float], prediction_length: int) -> Dict:
     """
-    Llama a la API de Hugging Face Inference para Chronos.
-    Retorna un diccionario con las predicciones.
     """
-    if client is None:
-        raise HTTPException(
-            status_code=503,
-            detail="HF_TOKEN no configurado. Contacta al administrador del servicio."
-        )
-    try:
-        # Intentar usando el endpoint específico de time series
-        import requests
-        url = f"https://router.huggingface.co/hf-inference/models/{MODEL_ID}"
-        headers = {"Authorization": f"Bearer {HF_TOKEN}"}
-        payload = {
-            "inputs": series,
-            "parameters": {
-                "prediction_length": prediction_length,
-                "num_samples": 100  # Para obtener cuantiles
-            }
-        }
-        response = requests.post(url, headers=headers, json=payload, timeout=60)
-        if response.status_code == 503:
-            raise HTTPException(
-                status_code=503,
-                detail="El modelo está cargando. Por favor, intenta de nuevo en 30-60 segundos."
             )
-        elif response.status_code != 200:
-            raise HTTPException(
-                status_code=response.status_code,
-                detail=f"Error de la API de HuggingFace: {response.text}"
             )
-        result = response.json()
-        return result
-    except requests.exceptions.Timeout:
-        raise HTTPException(
-            status_code=504,
-            detail="Timeout al comunicarse con HuggingFace API. El modelo puede estar cargando."
         )
-    except Exception as e:
-        raise HTTPException(
-            status_code=500,
-            detail=f"Error inesperado: {str(e)}"
         )
-def process_chronos_output(raw_output: Dict, prediction_length: int) -> Dict:
     """
-    Procesa la salida de Chronos para extraer mediana y cuantiles.
     """
-    # La API de Chronos puede devolver diferentes formatos
-    # Intentamos adaptarnos a ellos
-    if isinstance(raw_output, list):
-        # Si es una lista de valores, asumimos que es la predicción media
-        median = raw_output[:prediction_length]
-        return {
-            "median": median,
-            "quantiles": {
-                "0.1": median,  # Sin cuantiles, usar median
-                "0.5": median,
-                "0.9": median
-            }
-        }
-    # Si tiene estructura más compleja, intentar extraer
-    if "forecast" in raw_output:
-        forecast = raw_output["forecast"]
-        if "median" in forecast:
-            median = forecast["median"][:prediction_length]
-        else:
-            median = forecast.get("mean", [0] * prediction_length)[:prediction_length]
-        quantiles = forecast.get("quantiles", {})
-        return {
-            "median": median,
-            "quantiles": quantiles
         }
-    # Formato por defecto
-    return {
-        "median": [0] * prediction_length,
-        "quantiles": {
-            "0.1": [0] * prediction_length,
-            "0.5": [0] * prediction_length,
-            "0.9": [0] * prediction_length
         }
-    }
 # =========================
-# Endpoints
 # =========================
-@app.get("/")
-def root():
-    """Información básica de la API"""
-    return {
-        "name": "Chronos-2 Forecasting API",
-        "version": "1.0.0",
-        "model": MODEL_ID,
-        "status": "running",
-        "docs": "/docs",
-        "health": "/health"
-    }
-@app.get("/health")
-def health():
-    """Health check del servicio"""
-    return {
-        "status": "ok" if HF_TOKEN else "warning",
-        "model_id": MODEL_ID,
-        "hf_token_configured": HF_TOKEN is not None,
-        "message": "Ready" if HF_TOKEN else "HF_TOKEN not configured"
-    }
-@app.post("/forecast_univariate", response_model=ForecastUnivariateResponse)
-def forecast_univariate(req: ForecastUnivariateRequest):
     """
-    Pronóstico para una serie temporal univariada.
-    Compatible con el Excel Add-in.
     """
-    values = req.series.values
-    n = len(values)
-    if n == 0:
-        raise HTTPException(status_code=400, detail="La serie no puede estar vacía.")
-    if n < 3:
-        raise HTTPException(
-            status_code=400,
-            detail="La serie debe tener al menos 3 puntos históricos."
         )
-    # Llamar a la API de HuggingFace
-    raw_output = call_chronos_inference(values, req.prediction_length)
-    # Procesar la salida
-    processed = process_chronos_output(raw_output, req.prediction_length)
-    # Generar timestamps
-    timestamps = [f"t+{i+1}" for i in range(req.prediction_length)]
-    return ForecastUnivariateResponse(
-        timestamps=timestamps,
-        median=processed["median"],
-        quantiles=processed["quantiles"]
-    )
 @app.post("/detect_anomalies", response_model=AnomalyDetectionResponse)
 def detect_anomalies(req: AnomalyDetectionRequest):
     """
-    Detecta anomalías comparando valores observados con predicciones.
     """
     n_hist = len(req.context.values)
     if n_hist == 0:
-        raise HTTPException(status_code=400, detail="El contexto no puede estar vacío.")
     if len(req.recent_observed) != req.prediction_length:
         raise HTTPException(
             status_code=400,
-            detail="recent_observed debe tener la misma longitud que prediction_length."
         )
-    # Hacer predicción
-    raw_output = call_chronos_inference(req.context.values, req.prediction_length)
-    processed = process_chronos_output(raw_output, req.prediction_length)
-    # Comparar con valores observados
     anomalies: List[AnomalyPoint] = []
-    median = processed["median"]
-    # Intentar obtener cuantiles o usar aproximaciones
-    q_low = processed["quantiles"].get(str(req.quantile_low), median)
-    q_high = processed["quantiles"].get(str(req.quantile_high), median)
-    for i, obs in enumerate(req.recent_observed):
-        if i < len(median):
-            lower = q_low[i] if i < len(q_low) else median[i] * 0.8
-            upper = q_high[i] if i < len(q_high) else median[i] * 1.2
-            predicted = median[i]
-            is_anom = (obs < lower) or (obs > upper)
-            anomalies.append(
-                AnomalyPoint(
-                    index=i,
-                    value=obs,
-                    predicted_median=predicted,
-                    lower=lower,
-                    upper=upper,
-                    is_anomaly=is_anom,
-                )
             )
     return AnomalyDetectionResponse(anomalies=anomalies)
 @app.post("/backtest_simple", response_model=BacktestResponse)
 def backtest_simple(req: BacktestRequest):
     """
-    Backtesting simple: divide la serie en train/test y evalúa métricas.
     """
     values = np.array(req.series.values, dtype=float)
     n = len(values)
     if n <= req.test_length:
         raise HTTPException(
             status_code=400,
-            detail="La serie debe ser más larga que test_length."
         )
-    # Dividir en train/test
-    train = values[: n - req.test_length].tolist()
-    test = values[n - req.test_length :].tolist()
-    # Hacer predicción
-    raw_output = call_chronos_inference(train, req.test_length)
-    processed = process_chronos_output(raw_output, req.test_length)
-    forecast = np.array(processed["median"], dtype=float)
-    test_arr = np.array(test, dtype=float)
-    # Calcular métricas
-    mae = float(np.mean(np.abs(test_arr - forecast)))
-    rmse = float(np.sqrt(np.mean((test_arr - forecast) ** 2)))
-    eps = 1e-8
-    mape = float(np.mean(np.abs((test_arr - forecast) / (test_arr + eps)))) * 100.0
-    timestamps = [f"test_t{i+1}" for i in range(req.test_length)]
-    metrics = BacktestMetrics(mae=mae, mape=mape, rmse=rmse)
-    return BacktestResponse(
-        metrics=metrics,
-        forecast_median=forecast.tolist(),
-        forecast_timestamps=timestamps,
-        actuals=test,
     )
-# =========================
-# Endpoints simplificados para testing
-# =========================
-@app.post("/simple_forecast")
-def simple_forecast(series: List[float], prediction_length: int = 7):
-    """
-    Endpoint simplificado para testing rápido.
-    """
-    if not series:
-        raise HTTPException(status_code=400, detail="Serie vacía")
-    raw_output = call_chronos_inference(series, prediction_length)
-    processed = process_chronos_output(raw_output, prediction_length)
-    return {
-        "input_series": series,
-        "prediction_length": prediction_length,
-        "forecast": processed["median"],
-        "model": MODEL_ID
-    }
-if __name__ == "__main__":
-    import uvicorn
-    port = int(os.getenv("PORT", 7860))
-    uvicorn.run(app, host="0.0.0.0", port=port)

 import os
 from typing import List, Dict, Optional
 import numpy as np
 import pandas as pd
 from fastapi import FastAPI, HTTPException
 from fastapi.middleware.cors import CORSMiddleware
 from pydantic import BaseModel, Field
+from chronos import Chronos2Pipeline
 # =========================
+# Configuración del modelo
 # =========================
+MODEL_ID = os.getenv("CHRONOS_MODEL_ID", "amazon/chronos-2")
+DEVICE_MAP = os.getenv("DEVICE_MAP", "cpu")  # "cpu" o "cuda"
 app = FastAPI(
+    title="Chronos-2 Universal Forecasting API",
     description=(
+        "Servidor local (Docker) para pronósticos con Chronos-2: univariante, "
+        "multivariante, covariables, escenarios, anomalías y backtesting."
     ),
     version="1.0.0",
 )
+# Configurar CORS para Excel Add-in
 app.add_middleware(
     CORSMiddleware,
+    allow_origins=["https://localhost:3001", "https://localhost:3000"],
     allow_credentials=True,
     allow_methods=["*"],
     allow_headers=["*"],
 )
+# Carga única del modelo al iniciar el proceso
+pipeline = Chronos2Pipeline.from_pretrained(MODEL_ID, device_map=DEVICE_MAP)
 # =========================
+# Modelos Pydantic comunes
 # =========================
+class BaseForecastConfig(BaseModel):
+    prediction_length: int = Field(
+        7, description="Horizonte de predicción (número de pasos futuros)"
+    )
+    quantile_levels: List[float] = Field(
+        default_factory=lambda: [0.1, 0.5, 0.9],
+        description="Cuantiles para el pronóstico probabilístico",
+    )
+    start_timestamp: Optional[str] = Field(
+        default=None,
+        description=(
+            "Fecha/hora inicial del histórico (formato ISO). "
+            "Si no se especifica, se usan índices enteros."
+        ),
+    )
+    freq: str = Field(
+        "D",
+        description="Frecuencia temporal (p.ej. 'D' diario, 'H' horario, 'W' semanal...).",
+    )
 class UnivariateSeries(BaseModel):
     values: List[float]
+class MultiSeriesItem(BaseModel):
+    series_id: str
+    values: List[float]
+class CovariatePoint(BaseModel):
+    """
+    Punto temporal usado tanto para contexto (histórico) como para covariables futuras.
+    """
+    timestamp: Optional[str] = None      # opcional si se usan índices enteros
+    id: Optional[str] = None             # id de serie, por defecto 'series_0'
+    target: Optional[float] = None       # valor de la variable objetivo (histórico)
+    covariates: Dict[str, float] = Field(
+        default_factory=dict,
+        description="Nombre -> valor de cada covariable dinámica.",
     )
+# =========================
+# 1) Healthcheck
+# =========================
+@app.get("/health")
+def health():
+    """
+    Devuelve información básica del estado del servidor y el modelo cargado.
+    """
+    return {
+        "status": "ok",
+        "model_id": MODEL_ID,
+        "device_map": DEVICE_MAP,
+    }
+# =========================
+# 2) Pronóstico univariante
+# =========================
+class ForecastUnivariateRequest(BaseForecastConfig):
+    series: UnivariateSeries
 class ForecastUnivariateResponse(BaseModel):
     timestamps: List[str]
     median: List[float]
+    quantiles: Dict[str, List[float]]  # "0.1" -> [..], "0.9" -> [..]
+@app.post("/forecast_univariate", response_model=ForecastUnivariateResponse)
+def forecast_univariate(req: ForecastUnivariateRequest):
+    """
+    Pronóstico para una sola serie temporal (univariante, sin covariables).
+    Pensado para uso directo desde Excel u otras herramientas sencillas.
+    """
+    values = req.series.values
+    n = len(values)
+    if n == 0:
+        raise HTTPException(status_code=400, detail="La serie no puede estar vacía.")
+    # Construimos contexto como DataFrame largo (id, timestamp, target)
+    if req.start_timestamp:
+        timestamps = pd.date_range(
+            start=pd.to_datetime(req.start_timestamp),
+            periods=n,
+            freq=req.freq,
+        )
+    else:
+        timestamps = pd.RangeIndex(start=0, stop=n, step=1)
+    context_df = pd.DataFrame(
+        {
+            "id": ["series_0"] * n,
+            "timestamp": timestamps,
+            "target": values,
+        }
+    )
+    pred_df = pipeline.predict_df(
+        context_df,
+        prediction_length=req.prediction_length,
+        quantile_levels=req.quantile_levels,
+        id_column="id",
+        timestamp_column="timestamp",
+        target="target",
+    )
+    pred_df = pred_df.sort_values("timestamp")
+    timestamps_out = pred_df["timestamp"].astype(str).tolist()
+    median = pred_df["predictions"].astype(float).tolist()
+    quantiles_dict: Dict[str, List[float]] = {}
+    for q in req.quantile_levels:
+        key = f"{q:.3g}"
+        if key in pred_df.columns:
+            quantiles_dict[key] = pred_df[key].astype(float).tolist()
+    return ForecastUnivariateResponse(
+        timestamps=timestamps_out,
+        median=median,
+        quantiles=quantiles_dict,
+    )
+# =========================
+# 3) Multi-serie (multi-id)
+# =========================
+class ForecastMultiSeriesRequest(BaseForecastConfig):
+    series_list: List[MultiSeriesItem]
+class SeriesForecast(BaseModel):
+    series_id: str
+    timestamps: List[str]
+    median: List[float]
+    quantiles: Dict[str, List[float]]
+class ForecastMultiSeriesResponse(BaseModel):
+    forecasts: List[SeriesForecast]
+@app.post("/forecast_multi_id", response_model=ForecastMultiSeriesResponse)
+def forecast_multi_id(req: ForecastMultiSeriesRequest):
     """
+    Pronóstico para múltiples series (por ejemplo, varios SKU o tiendas).
     """
+    if not req.series_list:
+        raise HTTPException(status_code=400, detail="Debes enviar al menos una serie.")
+    frames = []
+    for item in req.series_list:
+        n = len(item.values)
+        if n == 0:
+            continue
+        if req.start_timestamp:
+            timestamps = pd.date_range(
+                start=pd.to_datetime(req.start_timestamp),
+                periods=n,
+                freq=req.freq,
             )
+        else:
+            timestamps = pd.RangeIndex(start=0, stop=n, step=1)
+        frames.append(
+            pd.DataFrame(
+                {
+                    "id": [item.series_id] * n,
+                    "timestamp": timestamps,
+                    "target": item.values,
+                }
             )
         )
+    if not frames:
+        raise HTTPException(status_code=400, detail="Todas las series están vacías.")
+    context_df = pd.concat(frames, ignore_index=True)
+    pred_df = pipeline.predict_df(
+        context_df,
+        prediction_length=req.prediction_length,
+        quantile_levels=req.quantile_levels,
+        id_column="id",
+        timestamp_column="timestamp",
+        target="target",
+    )
+    forecasts: List[SeriesForecast] = []
+    for series_id, group in pred_df.groupby("id"):
+        group = group.sort_values("timestamp")
+        timestamps_out = group["timestamp"].astype(str).tolist()
+        median = group["predictions"].astype(float).tolist()
+        quantiles_dict: Dict[str, List[float]] = {}
+        for q in req.quantile_levels:
+            key = f"{q:.3g}"
+            if key in group.columns:
+                quantiles_dict[key] = group[key].astype(float).tolist()
+        forecasts.append(
+            SeriesForecast(
+                series_id=series_id,
+                timestamps=timestamps_out,
+                median=median,
+                quantiles=quantiles_dict,
+            )
         )
+    return ForecastMultiSeriesResponse(forecasts=forecasts)
+# =========================
+# 4) Pronóstico con covariables
+# =========================
+class ForecastWithCovariatesRequest(BaseForecastConfig):
+    context: List[CovariatePoint]
+    future: Optional[List[CovariatePoint]] = None
+class ForecastWithCovariatesResponse(BaseModel):
+    # filas con todas las columnas de pred_df serializadas como string
+    pred_df: List[Dict[str, str]]
+@app.post("/forecast_with_covariates", response_model=ForecastWithCovariatesResponse)
+def forecast_with_covariates(req: ForecastWithCovariatesRequest):
     """
+    Pronóstico con información de covariables (promos, precio, clima...) tanto
+    en el histórico (context) como en futuros posibles (future).
     """
+    if not req.context:
+        raise HTTPException(status_code=400, detail="El contexto no puede estar vacío.")
+    ctx_rows = []
+    for p in req.context:
+        if p.target is None:
+            continue
+        row = {
+            "id": p.id or "series_0",
+            "timestamp": p.timestamp,
+            "target": p.target,
         }
+        for k, v in p.covariates.items():
+            row[k] = v
+        ctx_rows.append(row)
+    context_df = pd.DataFrame(ctx_rows)
+    if "timestamp" not in context_df or context_df["timestamp"].isna().any():
+        context_df["timestamp"] = pd.RangeIndex(start=0, stop=len(context_df), step=1)
+    future_df = None
+    if req.future:
+        fut_rows = []
+        for p in req.future:
+            row = {
+                "id": p.id or "series_0",
+                "timestamp": p.timestamp,
+            }
+            for k, v in p.covariates.items():
+                row[k] = v
+            fut_rows.append(row)
+        future_df = pd.DataFrame(fut_rows)
+        if "timestamp" not in future_df or future_df["timestamp"].isna().any():
+            future_df["timestamp"] = pd.RangeIndex(
+                start=context_df["timestamp"].max() + 1,
+                stop=context_df["timestamp"].max() + 1 + len(future_df),
+                step=1,
+            )
+    pred_df = pipeline.predict_df(
+        context_df,
+        future_df=future_df,
+        prediction_length=req.prediction_length,
+        quantile_levels=req.quantile_levels,
+        id_column="id",
+        timestamp_column="timestamp",
+        target="target",
+    )
+    pred_df = pred_df.sort_values(["id", "timestamp"])
+    out_records: List[Dict[str, str]] = []
+    for _, row in pred_df.iterrows():
+        record = {k: str(v) for k, v in row.items()}
+        out_records.append(record)
+    return ForecastWithCovariatesResponse(pred_df=out_records)
+# =========================
+# 5) Multivariante (varios targets)
+# =========================
+class MultivariateContextPoint(BaseModel):
+    timestamp: Optional[str] = None
+    id: Optional[str] = None
+    targets: Dict[str, float]            # p.ej. {"demand": 100, "returns": 5}
+    covariates: Dict[str, float] = Field(default_factory=dict)
+class ForecastMultivariateRequest(BaseForecastConfig):
+    context: List[MultivariateContextPoint]
+    target_columns: List[str]            # nombres de columnas objetivo
+class ForecastMultivariateResponse(BaseModel):
+    pred_df: List[Dict[str, str]]
+@app.post("/forecast_multivariate", response_model=ForecastMultivariateResponse)
+def forecast_multivariate(req: ForecastMultivariateRequest):
+    """
+    Pronóstico multivariante: múltiples columnas objetivo (p.ej. demanda y devoluciones).
+    """
+    if not req.context:
+        raise HTTPException(status_code=400, detail="El contexto no puede estar vacío.")
+    if not req.target_columns:
+        raise HTTPException(status_code=400, detail="Debes indicar columnas objetivo.")
+    rows = []
+    for p in req.context:
+        base = {
+            "id": p.id or "series_0",
+            "timestamp": p.timestamp,
         }
+        for t_name, t_val in p.targets.items():
+            base[t_name] = t_val
+        for k, v in p.covariates.items():
+            base[k] = v
+        rows.append(base)
+    context_df = pd.DataFrame(rows)
+    if "timestamp" not in context_df or context_df["timestamp"].isna().any():
+        context_df["timestamp"] = pd.RangeIndex(start=0, stop=len(context_df), step=1)
+    pred_df = pipeline.predict_df(
+        context_df,
+        prediction_length=req.prediction_length,
+        quantile_levels=req.quantile_levels,
+        id_column="id",
+        timestamp_column="timestamp",
+        target=req.target_columns,
+    )
+    pred_df = pred_df.sort_values(["id", "timestamp"])
+    out_records = [{k: str(v) for k, v in row.items()} for _, row in pred_df.iterrows()]
+    return ForecastMultivariateResponse(pred_df=out_records)
 # =========================
+# 6) Escenarios (what-if)
 # =========================
+class ScenarioDefinition(BaseModel):
+    name: str
+    future_covariates: List[CovariatePoint]
+class ScenarioForecast(BaseModel):
+    name: str
+    pred_df: List[Dict[str, str]]
+class ForecastScenariosRequest(BaseForecastConfig):
+    context: List[CovariatePoint]
+    scenarios: List[ScenarioDefinition]
+class ForecastScenariosResponse(BaseModel):
+    scenarios: List[ScenarioForecast]
+@app.post("/forecast_scenarios", response_model=ForecastScenariosResponse)
+def forecast_scenarios(req: ForecastScenariosRequest):
     """
+    Evaluación de múltiples escenarios (what-if) cambiando las covariables futuras
+    (por ejemplo, promo ON/OFF, diferentes precios, etc.).
     """
+    if not req.context:
+        raise HTTPException(status_code=400, detail="El contexto no puede estar vacío.")
+    if not req.scenarios:
+        raise HTTPException(status_code=400, detail="Debes definir al menos un escenario.")
+    ctx_rows = []
+    for p in req.context:
+        if p.target is None:
+            continue
+        row = {
+            "id": p.id or "series_0",
+            "timestamp": p.timestamp,
+            "target": p.target,
+        }
+        for k, v in p.covariates.items():
+            row[k] = v
+        ctx_rows.append(row)
+    context_df = pd.DataFrame(ctx_rows)
+    if "timestamp" not in context_df or context_df["timestamp"].isna().any():
+        context_df["timestamp"] = pd.RangeIndex(start=0, stop=len(context_df), step=1)
+    results: List[ScenarioForecast] = []
+    for scen in req.scenarios:
+        fut_rows = []
+        for p in scen.future_covariates:
+            row = {
+                "id": p.id or "series_0",
+                "timestamp": p.timestamp,
+            }
+            for k, v in p.covariates.items():
+                row[k] = v
+            fut_rows.append(row)
+        future_df = pd.DataFrame(fut_rows)
+        if "timestamp" not in future_df or future_df["timestamp"].isna().any():
+            future_df["timestamp"] = pd.RangeIndex(
+                start=context_df["timestamp"].max() + 1,
+                stop=context_df["timestamp"].max() + 1 + len(future_df),
+                step=1,
+            )
+        pred_df = pipeline.predict_df(
+            context_df,
+            future_df=future_df,
+            prediction_length=req.prediction_length,
+            quantile_levels=req.quantile_levels,
+            id_column="id",
+            timestamp_column="timestamp",
+            target="target",
         )
+        pred_df = pred_df.sort_values(["id", "timestamp"])
+        out_records = [{k: str(v) for k, v in row.items()} for _, row in pred_df.iterrows()]
+        results.append(ScenarioForecast(name=scen.name, pred_df=out_records))
+    return ForecastScenariosResponse(scenarios=results)
+# =========================
+# 7) Detección de anomalías
+# =========================
+class AnomalyDetectionRequest(BaseModel):
+    context: UnivariateSeries
+    recent_observed: List[float]
+    prediction_length: int = 7
+    quantile_low: float = 0.05
+    quantile_high: float = 0.95
+class AnomalyPoint(BaseModel):
+    index: int
+    value: float
+    predicted_median: float
+    lower: float
+    upper: float
+    is_anomaly: bool
+class AnomalyDetectionResponse(BaseModel):
+    anomalies: List[AnomalyPoint]
 @app.post("/detect_anomalies", response_model=AnomalyDetectionResponse)
 def detect_anomalies(req: AnomalyDetectionRequest):
     """
+    Marca como anomalías los puntos observados recientes que caen fuera del
+    intervalo [quantile_low, quantile_high] del pronóstico.
     """
     n_hist = len(req.context.values)
     if n_hist == 0:
+        raise HTTPException(status_code=400, detail="La serie histórica no puede estar vacía.")
     if len(req.recent_observed) != req.prediction_length:
         raise HTTPException(
             status_code=400,
+            detail="recent_observed debe tener la misma longitud que prediction_length.",
         )
+    context_df = pd.DataFrame(
+        {
+            "id": ["series_0"] * n_hist,
+            "timestamp": pd.RangeIndex(start=0, stop=n_hist, step=1),
+            "target": req.context.values,
+        }
+    )
+    quantiles = sorted({req.quantile_low, 0.5, req.quantile_high})
+    pred_df = pipeline.predict_df(
+        context_df,
+        prediction_length=req.prediction_length,
+        quantile_levels=quantiles,
+        id_column="id",
+        timestamp_column="timestamp",
+        target="target",
+    ).sort_values("timestamp")
+    q_low_col = f"{req.quantile_low:.3g}"
+    q_high_col = f"{req.quantile_high:.3g}"
     anomalies: List[AnomalyPoint] = []
+    for i, (obs, (_, row)) in enumerate(zip(req.recent_observed, pred_df.iterrows())):
+        lower = float(row[q_low_col])
+        upper = float(row[q_high_col])
+        median = float(row["predictions"])
+        is_anom = (obs < lower) or (obs > upper)
+        anomalies.append(
+            AnomalyPoint(
+                index=i,
+                value=obs,
+                predicted_median=median,
+                lower=lower,
+                upper=upper,
+                is_anomaly=is_anom,
             )
+        )
     return AnomalyDetectionResponse(anomalies=anomalies)
+# =========================
+# 8) Backtest simple
+# =========================
+class BacktestRequest(BaseModel):
+    series: UnivariateSeries
+    prediction_length: int = 7
+    test_length: int = 28
+class BacktestMetrics(BaseModel):
+    mae: float
+    mape: float
+    wql: float  # Weighted Quantile Loss aproximada para el cuantil 0.5
+class BacktestResponse(BaseModel):
+    metrics: BacktestMetrics
+    forecast_median: List[float]
+    forecast_timestamps: List[str]
+    actuals: List[float]
 @app.post("/backtest_simple", response_model=BacktestResponse)
 def backtest_simple(req: BacktestRequest):
     """
+    Backtest sencillo: separamos un tramo final de la serie como test, pronosticamos
+    ese tramo y calculamos métricas MAE / MAPE / WQL.
     """
     values = np.array(req.series.values, dtype=float)
     n = len(values)
     if n <= req.test_length:
         raise HTTPException(
             status_code=400,
+            detail="La serie debe ser más larga que test_length.",
         )
+    train = values[: n - req.test_length]
+    test = values[n - req.test_length :]
+    context_df = pd.DataFrame(
+        {
+            "id": ["series_0"] * len(train),
+            "timestamp": pd.RangeIndex(start=0, stop=len(train), step=1),
+            "target": train.tolist(),
+        }
     )
+    pred_df = pipeline.predict_df(
+        context_df,
+        prediction_length=req.test_length,
+        quantile_levels=[0.5],
+        id_column="id",
+        timestamp_column="timestamp",
+        target="target",
+    ).sort_values("timestamp")
+    forecast = pred_df["predictions"].to_numpy(dtype=float)
+    timestamps = pred_df["timestamp"].astype(str).tolist()
+    mae = float(np.mean(np.abs(test - forecast)))
+    eps = 1e-8
+    mape = float(np.mean(np.abs((test - forecast) / (test + eps)))) * 100.0
+    tau = 0.5
+    diff = test - forecast
+    wql = float(np.mean(np.maximum(tau * diff, (tau - 1) * diff)))
+    metrics = BacktestMetrics(mae=mae, mape=mape, wql=wql)
+    return BacktestResponse(
+        metrics=metrics,
+        forecast_median=forecast.tolist(),
+        forecast_timestamps=timestamps,
+        actuals=test.tolist(),
+    )

requirements.txt CHANGED Viewed

@@ -2,7 +2,7 @@ fastapi>=0.104.0
 uvicorn[standard]>=0.24.0
 pandas>=2.0.0
 numpy>=1.24.0
-huggingface_hub>=0.20.0
 pydantic>=2.0.0
 python-dotenv>=1.0.0
-requests>=2.31.0

 uvicorn[standard]>=0.24.0
 pandas>=2.0.0
 numpy>=1.24.0
 pydantic>=2.0.0
 python-dotenv>=1.0.0
+chronos-forecasting>=1.0.0
+torch>=2.0.0