Spaces:

DataQuests
/

DeepCritical

Running

VibecoderMcSwaggins commited on 13 days ago

Commit

15459e9

1 Parent(s): 7057335

fix(phase5): align configs and add agent tests

- Add PLR0912, PLC0415 to ruff ignore list for complex orchestrator logic
- Disable warn_unused_ignores in mypy (vendored lib needs type: ignore)
- Fix single ChatMessage input handling in SearchAgent/JudgeAgent
- Add comprehensive unit tests for SearchAgent and JudgeAgent wrappers
- All 38 tests pass, lint and mypy clean, pre-commit aligned

Files changed (7) hide show

pyproject.toml +3 -1
src/agents/judge_agent.py +2 -0
src/agents/search_agent.py +2 -0
src/orchestrator_magentic.py +1 -1
tests/unit/agents/__init__.py +0 -0
tests/unit/agents/test_judge_agent.py +124 -0
tests/unit/agents/test_search_agent.py +81 -0

pyproject.toml CHANGED Viewed

@@ -76,6 +76,8 @@ select = [
 ]
 ignore = [
     "PLR0913",  # Too many arguments (agents need many params)
 ]
 [tool.ruff.lint.isort]
@@ -88,7 +90,7 @@ strict = true
 ignore_missing_imports = true
 disallow_untyped_defs = true
 warn_return_any = true
-warn_unused_ignores = true
 # ============== PYTEST CONFIG ==============
 [tool.pytest.ini_options]

 ]
 ignore = [
     "PLR0913",  # Too many arguments (agents need many params)
+    "PLR0912",  # Too many branches (complex orchestrator logic)
+    "PLC0415",  # Lazy imports for optional dependencies
 ]
 [tool.ruff.lint.isort]
 ignore_missing_imports = true
 disallow_untyped_defs = true
 warn_return_any = true
+warn_unused_ignores = false
 # ============== PYTEST CONFIG ==============
 [tool.pytest.ini_options]

src/agents/judge_agent.py CHANGED Viewed

@@ -51,6 +51,8 @@ class JudgeAgent(BaseAgent):  # type: ignore[misc]
                     break
         elif isinstance(messages, str):
             question = messages
         # Get evidence from shared store
         evidence = self._evidence_store.get("current", [])

                     break
         elif isinstance(messages, str):
             question = messages
+        elif isinstance(messages, ChatMessage) and messages.text:
+            question = messages.text
         # Get evidence from shared store
         evidence = self._evidence_store.get("current", [])

src/agents/search_agent.py CHANGED Viewed

@@ -49,6 +49,8 @@ class SearchAgent(BaseAgent):  # type: ignore[misc]
                     break
         elif isinstance(messages, str):
             query = messages
         if not query:
             return AgentRunResponse(

                     break
         elif isinstance(messages, str):
             query = messages
+        elif isinstance(messages, ChatMessage) and messages.text:
+            query = messages.text
         if not query:
             return AgentRunResponse(

src/orchestrator_magentic.py CHANGED Viewed

@@ -40,7 +40,7 @@ class MagenticOrchestrator:
         self._max_rounds = max_rounds
         self._evidence_store: dict[str, list[Evidence]] = {"current": []}
-    async def run(self, query: str) -> AsyncGenerator[AgentEvent, None]:  # noqa: PLR0912
         """
         Run the Magentic workflow - same API as simple Orchestrator.

         self._max_rounds = max_rounds
         self._evidence_store: dict[str, list[Evidence]] = {"current": []}
+    async def run(self, query: str) -> AsyncGenerator[AgentEvent, None]:
         """
         Run the Magentic workflow - same API as simple Orchestrator.

tests/unit/agents/__init__.py ADDED Viewed

File without changes

tests/unit/agents/test_judge_agent.py ADDED Viewed

	@@ -0,0 +1,124 @@

+"""Unit tests for JudgeAgent."""
+from unittest.mock import AsyncMock
+import pytest
+from agent_framework import ChatMessage, Role
+from src.agents.judge_agent import JudgeAgent
+from src.utils.models import AssessmentDetails, Citation, Evidence, JudgeAssessment
+@pytest.fixture
+def mock_assessment() -> JudgeAssessment:
+    """Create a mock JudgeAssessment."""
+    return JudgeAssessment(
+        details=AssessmentDetails(
+            mechanism_score=8,
+            mechanism_reasoning="Strong mechanism evidence",
+            clinical_evidence_score=7,
+            clinical_reasoning="Good clinical data",
+            drug_candidates=["Metformin"],
+            key_findings=["Key finding 1"],
+        ),
+        sufficient=True,
+        confidence=0.85,
+        recommendation="synthesize",
+        next_search_queries=[],
+        reasoning="Evidence is sufficient for synthesis",
+    )
+@pytest.fixture
+def mock_handler(mock_assessment: JudgeAssessment) -> AsyncMock:
+    """Mock judge handler."""
+    handler = AsyncMock()
+    handler.assess.return_value = mock_assessment
+    return handler
+@pytest.fixture
+def sample_evidence() -> list[Evidence]:
+    """Sample evidence for tests."""
+    return [
+        Evidence(
+            content="Test content",
+            citation=Citation(
+                source="pubmed",
+                title="Test Title",
+                url="http://test.com",
+                date="2023",
+            ),
+        )
+    ]
+@pytest.mark.asyncio
+async def test_run_assesses_evidence(
+    mock_handler: AsyncMock,
+    sample_evidence: list[Evidence],
+) -> None:
+    """Test that run assesses evidence from store."""
+    store: dict = {"current": sample_evidence}
+    agent = JudgeAgent(mock_handler, store)
+    response = await agent.run("test question")
+    # Check handler called with evidence from store
+    mock_handler.assess.assert_awaited_once()
+    call_args = mock_handler.assess.call_args
+    assert call_args[0][0] == "test question"
+    assert call_args[0][1] == sample_evidence
+    # Check response
+    assert response.messages[0].role == Role.ASSISTANT
+    assert "synthesize" in response.messages[0].text
+@pytest.mark.asyncio
+async def test_run_handles_chat_message_input(
+    mock_handler: AsyncMock,
+    sample_evidence: list[Evidence],
+) -> None:
+    """Test that run handles ChatMessage input."""
+    store: dict = {"current": sample_evidence}
+    agent = JudgeAgent(mock_handler, store)
+    message = ChatMessage(role=Role.USER, text="test question")
+    await agent.run(message)
+    mock_handler.assess.assert_awaited_once()
+    assert mock_handler.assess.call_args[0][0] == "test question"
+@pytest.mark.asyncio
+async def test_run_handles_list_input(
+    mock_handler: AsyncMock,
+    sample_evidence: list[Evidence],
+) -> None:
+    """Test that run handles list of messages."""
+    store: dict = {"current": sample_evidence}
+    agent = JudgeAgent(mock_handler, store)
+    messages = [
+        ChatMessage(role=Role.SYSTEM, text="sys"),
+        ChatMessage(role=Role.USER, text="test question"),
+    ]
+    await agent.run(messages)
+    mock_handler.assess.assert_awaited_once()
+    assert mock_handler.assess.call_args[0][0] == "test question"
+@pytest.mark.asyncio
+async def test_run_uses_empty_evidence_when_store_empty(
+    mock_handler: AsyncMock,
+) -> None:
+    """Test that run works with empty evidence store."""
+    store: dict = {"current": []}
+    agent = JudgeAgent(mock_handler, store)
+    await agent.run("test")
+    mock_handler.assess.assert_awaited_once()
+    assert mock_handler.assess.call_args[0][1] == []

tests/unit/agents/test_search_agent.py ADDED Viewed

	@@ -0,0 +1,81 @@

+"""Unit tests for SearchAgent."""
+from unittest.mock import AsyncMock
+import pytest
+from agent_framework import ChatMessage, Role
+from src.agents.search_agent import SearchAgent
+from src.utils.models import Citation, Evidence, SearchResult
+@pytest.fixture
+def mock_handler() -> AsyncMock:
+    """Mock search handler."""
+    handler = AsyncMock()
+    handler.execute.return_value = SearchResult(
+        query="test query",
+        evidence=[
+            Evidence(
+                content="test content",
+                citation=Citation(
+                    source="pubmed",
+                    title="Test Title",
+                    url="http://test.com",
+                    date="2023",
+                    authors=["Author A"],
+                ),
+                relevance=1.0,
+            )
+        ],
+        sources_searched=["pubmed"],
+        total_found=1,
+    )
+    return handler
+@pytest.mark.asyncio
+async def test_run_executes_search(mock_handler: AsyncMock) -> None:
+    """Test that run executes search and updates evidence store."""
+    store: dict = {"current": []}
+    agent = SearchAgent(mock_handler, store)
+    response = await agent.run("test query")
+    # Check handler called
+    mock_handler.execute.assert_awaited_once_with("test query", max_results_per_tool=10)
+    # Check store updated
+    assert len(store["current"]) == 1
+    assert store["current"][0].content == "test content"
+    # Check response
+    assert response.messages[0].role == Role.ASSISTANT
+    assert "Found 1 sources" in response.messages[0].text
+@pytest.mark.asyncio
+async def test_run_handles_chat_message_input(mock_handler: AsyncMock) -> None:
+    """Test that run handles ChatMessage input."""
+    store: dict = {"current": []}
+    agent = SearchAgent(mock_handler, store)
+    message = ChatMessage(role=Role.USER, text="test query")
+    await agent.run(message)
+    mock_handler.execute.assert_awaited_once_with("test query", max_results_per_tool=10)
+@pytest.mark.asyncio
+async def test_run_handles_list_input(mock_handler: AsyncMock) -> None:
+    """Test that run handles list of messages."""
+    store: dict = {"current": []}
+    agent = SearchAgent(mock_handler, store)
+    messages = [
+        ChatMessage(role=Role.SYSTEM, text="sys"),
+        ChatMessage(role=Role.USER, text="test query"),
+    ]
+    await agent.run(messages)
+    mock_handler.execute.assert_awaited_once_with("test query", max_results_per_tool=10)