SAGE-Bench

Sleeping

App Files Files Community

sudanl commited on Sep 5

Commit

a0ae907

1 Parent(s): f24b2b1

fix: 增强排行榜数据加载的健壮性

Browse files

- 添加详细的调试日志来诊断数据加载问题
- 移除自动刷新功能，与原SAGE保持一致
- 添加异常处理确保数据加载错误不会导致崩溃
- 在界面中添加调试信息显示结果数量
- 优化初始化过程的日志输出

Files changed (1) hide show

app.py +53 -38

app.py CHANGED Viewed

@@ -57,45 +57,58 @@ def model_hyperlink(link, model_name):
 def get_leaderboard_dataframe():
     """Generate leaderboard dataframe from SAGE results"""
     if not SAGE_MODULES_AVAILABLE:
         return pd.DataFrame()
-    sage_results = load_initial_sage_results()
-    if not sage_results:
-        return pd.DataFrame()
-    # Convert to leaderboard format
-    leaderboard_data = []
-    for result in sage_results:
-        # Extract model name from submission_id
-        if result.submission_id.startswith("initial_"):
-            model_name = result.submission_id.split("_", 2)[-1].replace("_", " ")
-        else:
-            model_name = result.submission_id
-        # Create model hyperlink (for now just display name)
-        model_display = f"**{model_name}**"
-        row = {
-            "Model": model_display,
-            "Organization": result.organization,
-            "Overall (%)": result.results.get("sage_overall", 0),
-            "Mathematics (%)": result.results.get("sage_math", 0),
-            "Physics (%)": result.results.get("sage_physics", 0),
-            "Chemistry (%)": result.results.get("sage_chemistry", 0),
-            "Biology (%)": result.results.get("sage_biology", 0),
-            "Earth Science (%)": result.results.get("sage_earth_science", 0),
-            "Astronomy (%)": result.results.get("sage_astronomy", 0),
-            "Submission Date": result.submitted_time
-        }
-        leaderboard_data.append(row)
-    df = pd.DataFrame(leaderboard_data)
-    if not df.empty:
-        df = df.sort_values(by=["Overall (%)"], ascending=False)
-    return df
 def refresh_leaderboard():
     """Refresh the leaderboard data"""
@@ -103,7 +116,9 @@ def refresh_leaderboard():
     return get_leaderboard_dataframe()
 # Initialize data
 leaderboard_df = get_leaderboard_dataframe()
 # Define column types for the dataframe
 COLUMN_TYPES = ["markdown", "str", "number", "number", "number", "number", "number", "number", "number", "str"]
@@ -136,6 +151,10 @@ with demo:
     # Main leaderboard table
     gr.Markdown("## 🏆 SAGE Benchmark Results", elem_classes="markdown-text")
     leaderboard_table = gr.Dataframe(
         value=leaderboard_df,
         datatype=COLUMN_TYPES,
@@ -175,10 +194,6 @@ with demo:
                 process_sage_submission_simple,
                 inputs=[file_upload, org_textbox, email_textbox],
                 outputs=[submission_result]
-            ).then(
-                refresh_leaderboard,  # Auto-refresh after submission
-                inputs=[],
-                outputs=[leaderboard_table]
             )
         else:
             submit_button.click(

 def get_leaderboard_dataframe():
     """Generate leaderboard dataframe from SAGE results"""
+    print("🔄 Loading SAGE leaderboard data...")
     if not SAGE_MODULES_AVAILABLE:
+        print("❌ SAGE modules not available")
         return pd.DataFrame()
+    try:
+        sage_results = load_initial_sage_results()
+        print(f"📊 Loaded {len(sage_results)} SAGE results")
+        if not sage_results:
+            print("❌ No SAGE results found")
+            return pd.DataFrame()
+        # Convert to leaderboard format
+        leaderboard_data = []
+        for result in sage_results:
+            # Extract model name from submission_id
+            if result.submission_id.startswith("initial_"):
+                model_name = result.submission_id.split("_", 2)[-1].replace("_", " ")
+            else:
+                model_name = result.submission_id
+            # Create model hyperlink (for now just display name)
+            model_display = f"**{model_name}**"
+            row = {
+                "Model": model_display,
+                "Organization": result.organization,
+                "Overall (%)": result.results.get("sage_overall", 0),
+                "Mathematics (%)": result.results.get("sage_math", 0),
+                "Physics (%)": result.results.get("sage_physics", 0),
+                "Chemistry (%)": result.results.get("sage_chemistry", 0),
+                "Biology (%)": result.results.get("sage_biology", 0),
+                "Earth Science (%)": result.results.get("sage_earth_science", 0),
+                "Astronomy (%)": result.results.get("sage_astronomy", 0),
+                "Submission Date": result.submitted_time
+            }
+            leaderboard_data.append(row)
+        df = pd.DataFrame(leaderboard_data)
+        if not df.empty:
+            df = df.sort_values(by=["Overall (%)"], ascending=False)
+        print(f"✅ Generated dataframe with {len(df)} rows")
+        return df
+    except Exception as e:
+        print(f"❌ Error generating leaderboard dataframe: {e}")
+        import traceback
+        traceback.print_exc()
+        return pd.DataFrame()
 def refresh_leaderboard():
     """Refresh the leaderboard data"""
     return get_leaderboard_dataframe()
 # Initialize data
+print("🚀 Initializing SAGE-Bench leaderboard...")
 leaderboard_df = get_leaderboard_dataframe()
+print(f"📈 Leaderboard initialized with {len(leaderboard_df)} rows")
 # Define column types for the dataframe
 COLUMN_TYPES = ["markdown", "str", "number", "number", "number", "number", "number", "number", "number", "str"]
     # Main leaderboard table
     gr.Markdown("## 🏆 SAGE Benchmark Results", elem_classes="markdown-text")
+    # Debug information
+    gr.Markdown(f"📊 **Showing {len(leaderboard_df)} results**")
     leaderboard_table = gr.Dataframe(
         value=leaderboard_df,
         datatype=COLUMN_TYPES,
                 process_sage_submission_simple,
                 inputs=[file_upload, org_textbox, email_textbox],
                 outputs=[submission_result]
             )
         else:
             submit_button.click(