Spaces:

agents-course
/

Final_Assignment_Template

Running

Final_Assignment_Template / README.md

Update README.md

1984127 verified about 1 month ago

1.06 kB

GAIA Benchmark Agent

Este proyecto implementa un agente que responde preguntas del benchmark GAIA y envía los resultados al endpoint oficial para calcular el score.

Pregunta manual
- Escribe una pregunta en el cuadro de texto y haz clic en Submit.
- El agente responderá y mostrará un feedback simulado.
Ejecutar todo el benchmark
- Haz clic en Run & Submit All.
- El agente responderá todas las preguntas del benchmark y enviará las respuestas al servidor oficial.
- Verás el score real, el número de respuestas correctas y el mensaje del sistema.

Instala las dependencias:

pip install -r requirements.txt