Jeff's picture

3 5 1

Jeff

JiayuJeff

·

JiayuJeff

AI & ML interests

None yet

Recent Activity

authored a paper 27 days ago

CritiCal: Can Critique Help LLM Uncertainty or Confidence Calibration?

upvoted a paper 28 days ago

CritiCal: Can Critique Help LLM Uncertainty or Confidence Calibration?

commented on a paper 28 days ago

CritiCal: Can Critique Help LLM Uncertainty or Confidence Calibration?

View all activity

Organizations

None yet

authored a paper 27 days ago

CritiCal: Can Critique Help LLM Uncertainty or Confidence Calibration?

Paper • 2510.24505 • Published Oct 28 • 3

authored 2 papers about 1 month ago

CostBench: Evaluating Multi-Turn Cost-Optimal Planning and Adaptation in Dynamic Environments for LLM Tool-Use Agents

Paper • 2511.02734 • Published Nov 4 • 20

Mathematical Proof as a Litmus Test: Revealing Failure Modes of Advanced Large Reasoning Models

Paper • 2506.17114 • Published Jun 20

authored a paper 4 months ago

Diversity-Enhanced Reasoning for Subjective Questions

Paper • 2507.20187 • Published Jul 27 • 25