Spaces:

minhvtt
/

ChatbotRAG

Running

App Files Files Community

minhvtt commited on 7 days ago

Commit

7caa85c

verified ·

1 Parent(s): 70413d7

Upload 16 files

Browse files

Files changed (6) hide show

agent_chat_stream.py +99 -0
agent_service.py +258 -0
main.py +75 -192
prompts/feedback_agent.txt +51 -0
prompts/sales_agent.txt +47 -0
tools_service.py +0 -46

agent_chat_stream.py ADDED Viewed

	@@ -0,0 +1,99 @@

+"""
+Agent Chat Streaming Endpoint
+SSE-based real-time streaming for Sales & Feedback agents
+"""
+from typing import AsyncGenerator
+from stream_utils import format_sse, EVENT_STATUS, EVENT_TOKEN, EVENT_DONE, EVENT_ERROR, EVENT_METADATA
+from datetime import datetime
+async def agent_chat_stream(
+    request,
+    agent_service,
+    conversation_service
+) -> AsyncGenerator[str, None]:
+    """
+    Stream agent responses in real-time (SSE format)
+    Args:
+        request: ChatRequest with message, session_id, mode, user_id
+        agent_service: AgentService instance
+        conversation_service: ConversationService instance
+    Yields SSE events:
+        - status: Processing updates
+        - token: Text chunks
+        - metadata: Session info
+        - done: Completion signal
+        - error: Error messages
+    """
+    try:
+        # === SESSION MANAGEMENT ===
+        session_id = request.session_id
+        if not session_id:
+            session_id = conversation_service.create_session(
+                metadata={"user_agent": "api", "created_via": "agent_stream"},
+                user_id=request.user_id
+            )
+            yield format_sse(EVENT_METADATA, {"session_id": session_id})
+        # Get conversation history
+        history = conversation_service.get_history(session_id)
+        # Convert to messages format
+        messages = []
+        for h in history:
+            messages.append({"role": h["role"], "content": h["content"]})
+        # Determine mode
+        mode = getattr(request, 'mode', 'sales')  # Default to sales
+        # === STATUS UPDATE ===
+        if mode == 'feedback':
+            yield format_sse(EVENT_STATUS, "Đang kiểm tra lịch sử sự kiện của bạn...")
+        else:
+            yield format_sse(EVENT_STATUS, "Đang tư vấn...")
+        # === CALL AGENT ===
+        result = await agent_service.chat(
+            user_message=request.message,
+            conversation_history=messages,
+            mode=mode,
+            user_id=request.user_id
+        )
+        agent_response = result["message"]
+        # === STREAM RESPONSE TOKEN BY TOKEN ===
+        # Simple character-by-character streaming
+        chunk_size = 5  # Characters per chunk
+        for i in range(0, len(agent_response), chunk_size):
+            chunk = agent_response[i:i+chunk_size]
+            yield format_sse(EVENT_TOKEN, chunk)
+            # Small delay for smoother streaming
+            import asyncio
+            await asyncio.sleep(0.02)
+        # === SAVE HISTORY ===
+        conversation_service.add_message(
+            session_id=session_id,
+            role="user",
+            content=request.message
+        )
+        conversation_service.add_message(
+            session_id=session_id,
+            role="assistant",
+            content=agent_response
+        )
+        # === DONE ===
+        yield format_sse(EVENT_DONE, {
+            "session_id": session_id,
+            "timestamp": datetime.utcnow().isoformat(),
+            "mode": mode,
+            "tool_calls": len(result.get("tool_calls", []))
+        })
+    except Exception as e:
+        print(f"⚠️ Agent Stream Error: {e}")
+        yield format_sse(EVENT_ERROR, str(e))

agent_service.py ADDED Viewed

	@@ -0,0 +1,258 @@

+"""
+Agent Service - Central Brain for Sales & Feedback Agents
+Manages LLM conversation loop with tool calling
+"""
+from typing import Dict, Any, List, Optional
+import os
+from tools_service import ToolsService
+class AgentService:
+    """
+    Manages the conversation loop between User -> LLM -> Tools -> Response
+    """
+    def __init__(
+        self,
+        tools_service: ToolsService,
+        embedding_service,
+        qdrant_service,
+        advanced_rag,
+        hf_token: str
+    ):
+        self.tools_service = tools_service
+        self.embedding_service = embedding_service
+        self.qdrant_service = qdrant_service
+        self.advanced_rag = advanced_rag
+        self.hf_token = hf_token
+        # Load system prompts
+        self.prompts = self._load_prompts()
+    def _load_prompts(self) -> Dict[str, str]:
+        """Load system prompts from files"""
+        prompts = {}
+        prompts_dir = "prompts"
+        for mode in ["sales_agent", "feedback_agent"]:
+            filepath = os.path.join(prompts_dir, f"{mode}.txt")
+            try:
+                with open(filepath, 'r', encoding='utf-8') as f:
+                    prompts[mode] = f.read()
+                print(f"✓ Loaded prompt: {mode}")
+            except Exception as e:
+                print(f"⚠️ Error loading {mode} prompt: {e}")
+                prompts[mode] = ""
+        return prompts
+    async def chat(
+        self,
+        user_message: str,
+        conversation_history: List[Dict],
+        mode: str = "sales",  # "sales" or "feedback"
+        user_id: Optional[str] = None,
+        max_iterations: int = 3
+    ) -> Dict[str, Any]:
+        """
+        Main conversation loop
+        Args:
+            user_message: User's input
+            conversation_history: Previous messages [{"role": "user", "content": ...}, ...]
+            mode: "sales" or "feedback"
+            user_id: User ID (for feedback mode to check purchase history)
+            max_iterations: Maximum tool call iterations to prevent infinite loops
+        Returns:
+            {
+                "message": "Bot response",
+                "tool_calls": [...],  # List of tools called (for debugging)
+                "mode": mode
+            }
+        """
+        print(f"\n🤖 Agent Mode: {mode}")
+        print(f"👤 User Message: {user_message}")
+        # Select system prompt
+        system_prompt = self._get_system_prompt(mode)
+        # Build conversation context
+        messages = self._build_messages(system_prompt, conversation_history, user_message)
+        # Agentic loop: LLM may call tools multiple times
+        tool_calls_made = []
+        current_response = None
+        for iteration in range(max_iterations):
+            print(f"\n🔄 Iteration {iteration + 1}")
+            # Call LLM
+            llm_response = await self._call_llm(messages)
+            print(f"🧠 LLM Response: {llm_response[:200]}...")
+            # Check if LLM wants to call a tool
+            tool_result = await self.tools_service.parse_and_execute(llm_response)
+            if not tool_result:
+                # No tool call -> This is the final response
+                current_response = llm_response
+                break
+            # Tool was called
+            tool_calls_made.append(tool_result)
+            print(f"🔧 Tool Called: {tool_result.get('function')}")
+            # Add tool result to conversation
+            messages.append({
+                "role": "assistant",
+                "content": llm_response
+            })
+            messages.append({
+                "role": "system",
+                "content": f"Tool Result:\n{self._format_tool_result(tool_result)}"
+            })
+            # If tool returns "run_rag_search", handle it specially
+            if tool_result.get("result", {}).get("action") == "run_rag_search":
+                rag_results = await self._execute_rag_search(tool_result["result"]["query"])
+                messages[-1]["content"] = f"RAG Search Results:\n{rag_results}"
+        # Clean up response
+        final_response = current_response or llm_response
+        final_response = self._clean_response(final_response)
+        return {
+            "message": final_response,
+            "tool_calls": tool_calls_made,
+            "mode": mode
+        }
+    def _get_system_prompt(self, mode: str) -> str:
+        """Get system prompt for selected mode"""
+        prompt_key = f"{mode}_agent" if mode in ["sales", "feedback"] else "sales_agent"
+        return self.prompts.get(prompt_key, "")
+    def _build_messages(
+        self,
+        system_prompt: str,
+        history: List[Dict],
+        user_message: str
+    ) -> List[Dict]:
+        """Build messages array for LLM"""
+        messages = [{"role": "system", "content": system_prompt}]
+        # Add conversation history
+        messages.extend(history)
+        # Add current user message
+        messages.append({"role": "user", "content": user_message})
+        return messages
+    async def _call_llm(self, messages: List[Dict]) -> str:
+        """
+        Call HuggingFace LLM
+        Uses advanced_rag's chat method
+        """
+        try:
+            # Build prompt from messages
+            prompt = self._messages_to_prompt(messages)
+            # Call HF API via advanced_rag
+            response = await self.advanced_rag.chat_completion(
+                user_prompt=prompt,
+                context="",  # Context is already in system prompt
+                chat_history=[],  # History is in messages
+                token=self.hf_token
+            )
+            return response
+        except Exception as e:
+            print(f"⚠️ LLM Call Error: {e}")
+            return "Xin lỗi, tôi đang gặp chút vấn đề kỹ thuật. Bạn thử lại sau nhé!"
+    def _messages_to_prompt(self, messages: List[Dict]) -> str:
+        """Convert messages array to single prompt string"""
+        prompt_parts = []
+        for msg in messages:
+            role = msg["role"]
+            content = msg["content"]
+            if role == "system":
+                prompt_parts.append(f"[SYSTEM]\n{content}\n")
+            elif role == "user":
+                prompt_parts.append(f"[USER]\n{content}\n")
+            elif role == "assistant":
+                prompt_parts.append(f"[ASSISTANT]\n{content}\n")
+        return "\n".join(prompt_parts)
+    def _format_tool_result(self, tool_result: Dict) -> str:
+        """Format tool result for feeding back to LLM"""
+        result = tool_result.get("result", {})
+        if isinstance(result, dict):
+            # Pretty print key info
+            formatted = []
+            for key, value in result.items():
+                if key not in ["success", "error"]:
+                    formatted.append(f"{key}: {value}")
+            return "\n".join(formatted)
+        return str(result)
+    async def _execute_rag_search(self, query_params: Dict) -> str:
+        """
+        Execute RAG search for event discovery
+        Called when LLM wants to search_events
+        """
+        query = query_params.get("query", "")
+        vibe = query_params.get("vibe", "")
+        # Build search query
+        search_text = f"{query} {vibe}".strip()
+        print(f"🔍 RAG Search: {search_text}")
+        # Use embedding + qdrant
+        embedding = self.embedding_service.encode_text(search_text)
+        results = self.qdrant_service.search(
+            collection_name="events",
+            query_vector=embedding,
+            limit=5
+        )
+        # Format results
+        formatted = []
+        for i, result in enumerate(results, 1):
+            payload = result.payload or {}
+            texts = payload.get("texts", [])
+            text = texts[0] if texts else ""
+            event_id = payload.get("id_use", "")
+            formatted.append(f"{i}. {text[:100]}... (ID: {event_id})")
+        return "\n".join(formatted) if formatted else "Không tìm thấy sự kiện phù hợp."
+    def _clean_response(self, response: str) -> str:
+        """Remove JSON artifacts from final response"""
+        # Remove JSON blocks
+        if "```json" in response:
+            response = response.split("```json")[0]
+        if "```" in response:
+            response = response.split("```")[0]
+        # Remove tool call markers
+        if "{" in response and "tool_call" in response:
+            # Find the last natural sentence before JSON
+            lines = response.split("\n")
+            cleaned = []
+            for line in lines:
+                if "{" in line and "tool_call" in line:
+                    break
+                cleaned.append(line)
+            response = "\n".join(cleaned)
+        return response.strip()

main.py CHANGED Viewed

@@ -19,11 +19,8 @@ from pdf_parser import PDFIndexer
 from multimodal_pdf_parser import MultimodalPDFIndexer
 from conversation_service import ConversationService
 from tools_service import ToolsService
-from intent_classifier import IntentClassifier  # NEW
-from scenario_engine import ScenarioEngine  # NEW
-from lead_storage_service import LeadStorageService  # NEW
-from hybrid_chat_endpoint import hybrid_chat_endpoint  # NEW
-from hybrid_chat_stream import hybrid_chat_stream  # NEW: Streaming
 # Initialize FastAPI app
 app = FastAPI(
@@ -109,19 +106,18 @@ conversation_service = ConversationService(conversations_collection, max_history
 print("✓ Conversation Service initialized")
 # Initialize Tools Service
-tools_service = ToolsService(base_url="https://www.festavenue.site")
 print("✓ Tools Service initialized (Function Calling enabled)")
-# Initialize Hybrid Chat Components
-intent_classifier = IntentClassifier()
-print("✓ Intent Classifier initialized")
-scenario_engine = ScenarioEngine(scenarios_dir="scenarios")
-print("✓ Scenario Engine initialized")
-leads_collection = db["leads"]
-lead_storage = LeadStorageService(leads_collection)
-print("✓ Lead Storage Service initialized")
 print("✓ Services initialized successfully")
@@ -152,6 +148,7 @@ class ChatRequest(BaseModel):
     message: str
     session_id: Optional[str] = None  # Multi-turn conversation
     user_id: Optional[str] = None  # User identifier for session tracking
     use_rag: bool = True
     top_k: int = 3
     system_message: Optional[str] = """Bạn là trợ lý AI chuyên biệt cho hệ thống quản lý sự kiện và bán vé.
@@ -694,184 +691,11 @@ async def get_stats():
 # ============================================
-# ChatbotRAG Endpoints
 # ============================================
-# Import chat endpoint logic
-from hybrid_chat_endpoint import hybrid_chat_endpoint
-@app.post("/chat", response_model=ChatResponse)
-async def chat(request: ChatRequest):
-    """
-    Hybrid Conversational Chatbot: Scenario FSM + RAG
-    Features:
-    - ✅ Scenario-based flows (giá vé, đặt vé kịch bản)
-    - ✅ RAG knowledge retrieval (PDF, documents)
-    - ✅ Mid-scenario RAG interruption (answer off-topic questions)
-    - ✅ Lead collection (email, phone → MongoDB)
-    - ✅ Multi-turn conversations with state management
-    - ✅ Function calling (external API integration)
-    Flow:
-    1. User message → Intent classification
-    2. Route to: Scenario FSM OR RAG OR Hybrid
-    3. Execute flow + save state
-    4. Save conversation history
-    Example 1 - Start Price Inquiry Scenario:
-    ```
-    POST /chat
-    {
-      "message": "giá vé bao nhiêu?",
-      "use_rag": true
-    }
-    Response:
-    {
-      "response": "Hello 👋 Bạn muốn xem giá của show nào để mình báo đúng nè?",
-      "session_id": "abc-123",
-      "mode": "scenario",
-      "scenario_active": true
-    }
-    ```
-    Example 2 - Continue Scenario:
-    ```
-    POST /chat
-    {
-      "message": "Show A",
-      "session_id": "abc-123"
-    }
-    Response:
-    {
-      "response": "Bạn đi 1 mình hay đi nhóm...",
-      "mode": "scenario",
-      "scenario_active": true
-    }
-    ```
-    Example 3 - Mid-scenario RAG Question:
-    ```
-    POST /chat
-    {
-      "message": "sự kiện mấy giờ?",
-      "session_id": "abc-123"
-    }
-    # Bot answers from RAG, then resumes scenario
-    ```
-    Example 4 - Pure RAG Query:
-    ```
-    POST /chat
-    {
-      "message": "địa điểm sự kiện ở đâu?",
-      "use_rag": true
-    }
-    # Normal RAG response (không trigger scenario)
-    ```
-    """
-    return await hybrid_chat_endpoint(
-        request=request,
-        conversation_service=conversation_service,
-        intent_classifier=intent_classifier,
-        embedding_service=embedding_service,  # NEW: Required by handlers
-        qdrant_service=qdrant_service,        # NEW: Required by handlers
-        tools_service=tools_service,
-        advanced_rag=advanced_rag,
-        chat_history_collection=chat_history_collection,
-        hf_token=hf_token,
-        lead_storage=lead_storage
-    )
-@app.post("/chat/stream")
-async def chat_stream(request: ChatRequest):
-    """
-    Streaming Chat Endpoint (SSE - Server-Sent Events)
-    Real-time token-by-token response display
-    Features:
-    - ✅ Real-time "typing" effect
-    - ✅ Status updates (thinking, searching)
-    - ✅ Scenario: Simulated streaming (smooth typing)
-    - ✅ RAG: Real LLM streaming
-    - ✅ HTTP/2 compatible
-    Event Types:
-    - status: Bot status ("Đang suy nghĩ...", "Đang tìm kiếm...")
-    - token: Text chunks
-    - metadata: Session ID, context info
-    - done: Completion signal
-    - error: Error messages
-    Example - JavaScript Client:
-    ```javascript
-    const response = await fetch('/chat/stream', {
-      method: 'POST',
-      headers: { 'Content-Type': 'application/json' },
-      body: JSON.stringify({
-        message: "giá vé bao nhiêu?",
-        use_rag: true
-      })
-    });
-    const reader = response.body.getReader();
-    const decoder = new TextDecoder();
-    while (true) {
-      const {done, value} = await reader.read();
-      if (done) break;
-      const chunk = decoder.decode(value);
-      const lines = chunk.split('\n\n');
-      for (const line of lines) {
-        if (line.startsWith('event: token')) {
-          const data = line.split('data: ')[1];
-          displayToken(data); // Append to UI
-        }
-        else if (line.startsWith('event: done')) {
-          console.log('Stream complete');
-        }
-      }
-    }
-    ```
-    Example - EventSource (simpler but less control):
-    ```javascript
-    // Note: EventSource doesn't support POST, need to use fetch
-    const eventSource = new EventSource('/chat/stream?message=hello');
-    eventSource.addEventListener('token', (e) => {
-      displayToken(e.data);
-    });
-    eventSource.addEventListener('done', (e) => {
-      eventSource.close();
-    });
-    ```
-    """
-    return StreamingResponse(
-        hybrid_chat_stream(
-            request=request,
-            conversation_service=conversation_service,
-            intent_classifier=intent_classifier,
-            embedding_service=embedding_service,  # For handlers
-            qdrant_service=qdrant_service,        # For handlers
-            advanced_rag=advanced_rag,
-            hf_token=hf_token,
-            lead_storage=lead_storage
-        ),
-        media_type="text/event-stream",
-        headers={
-            "Cache-Control": "no-cache",
-            "Connection": "keep-alive",
-            "X-Accel-Buffering": "no"  # Disable nginx buffering
-        }
-    )
 @app.get("/chat/history/{session_id}")
@@ -1421,6 +1245,65 @@ async def delete_document_from_kb(doc_id: str):
         raise HTTPException(status_code=500, detail=f"Error: {str(e)}")
 if __name__ == "__main__":
     import uvicorn
     uvicorn.run(

 from multimodal_pdf_parser import MultimodalPDFIndexer
 from conversation_service import ConversationService
 from tools_service import ToolsService
+from agent_service import AgentService
+from agent_chat_stream import agent_chat_stream  # NEW: Agent Streaming
 # Initialize FastAPI app
 app = FastAPI(
 print("✓ Conversation Service initialized")
 # Initialize Tools Service
+tools_service = ToolsService(base_url="https://hoalacrent.io.vn/api/v0")
 print("✓ Tools Service initialized (Function Calling enabled)")
+# Initialize Agent Service (Agentic Workflow)
+agent_service = AgentService(
+    tools_service=tools_service,
+    embedding_service=embedding_service,
+    qdrant_service=qdrant_service,
+    advanced_rag=advanced_rag,
+    hf_token=hf_token
+)
+print("✓ Agent Service initialized (Agentic Workflow enabled)")
 print("✓ Services initialized successfully")
     message: str
     session_id: Optional[str] = None  # Multi-turn conversation
     user_id: Optional[str] = None  # User identifier for session tracking
+    mode: str = "sales"  # NEW: "sales" or "feedback" for agent selection
     use_rag: bool = True
     top_k: int = 3
     system_message: Optional[str] = """Bạn là trợ lý AI chuyên biệt cho hệ thống quản lý sự kiện và bán vé.
 # ============================================
+# ChatbotRAG Endpoints - DEPRECATED
+# USE /agent/chat INSTEAD
 # ============================================
+# Old endpoints removed - now using Agentic Workflow via /agent/chat
 @app.get("/chat/history/{session_id}")
         raise HTTPException(status_code=500, detail=f"Error: {str(e)}")
+# ===================================
+# AGENT CHAT STREAMING ENDPOINT (NEW)
+# ===================================
+@app.post("/agent/chat")
+async def agent_chat(request: ChatRequest):
+    """
+    🤖 **Agentic Chatbot với SSE Streaming**
+    **Modes:**
+    - `sales`: Sales Agent - Tư vấn sự kiện, chốt sale
+    - `feedback`: Feedback Agent - CSKH, thu thập đánh giá
+    **Features:**
+    - ✅ LLM-driven conversation (no hard-coded scenarios)
+    - ✅ Automatic tool calling (search, get_event_details, save_lead...)
+    - ✅ Real-time SSE streaming
+    - ✅ Purchase history check (for feedback mode)
+    **Example:**
+    ```
+    POST /agent/chat
+    {
+      "message": "Tìm event cho tôi",
+      "mode": "sales",
+      "user_id": "user_123"
+    }
+    ```
+    **SSE Stream:**
+    ```
+    event: status
+    data: Đang tư vấn...
+    event: token
+    data: Hello
+    event: token
+    data:  👋
+    event: done
+    data: {"session_id": "...", "mode": "sales"}
+    ```
+    """
+    return StreamingResponse(
+        agent_chat_stream(
+            request=request,
+            agent_service=agent_service,
+            conversation_service=conversation_service
+        ),
+        media_type="text/event-stream",
+        headers={
+            "Cache-Control": "no-cache",
+            "Connection": "keep-alive",
+            "X-Accel-Buffering": "no"
+        }
+    )
 if __name__ == "__main__":
     import uvicorn
     uvicorn.run(

prompts/feedback_agent.txt ADDED Viewed

	@@ -0,0 +1,51 @@

+# ROLE
+Bạn là chuyên viên Chăm sóc khách hàng (CSKH) của nền tảng bán vé sự kiện.
+Nhiệm vụ của bạn là lắng nghe phản hồi của khách hàng sau khi tham gia sự kiện và hỗ trợ họ.
+# GOAL
+1. Kiểm tra xem khách hàng đã tham gia sự kiện nào chưa.
+2. Nếu CÓ: Xin đánh giá (feedback), cảm nhận để cải thiện dịch vụ.
+3. Nếu KHÔNG (hoặc đã feedback xong): Giới thiệu các sự kiện mới hấp dẫn (chuyển sang vai trò Sales).
+# CAPABILITIES (TOOLS)
+1. `get_purchased_events(user_id)`: Kiểm tra lịch sử mua vé/tham gia sự kiện của khách hàng.
+2. `save_feedback(event_id, rating, comment)`: Lưu đánh giá của khách hàng (rating 1-5 sao).
+3. `search_events(...)`: Tìm sự kiện mới (nếu khách muốn đi tiếp).
+# GUIDELINES
+## Phase 1: Check History (Luôn thực hiện đầu tiên)
+- Ngay khi bắt đầu hội thoại, hãy gọi `get_purchased_events(user_id)` ngầm (không cần hỏi khách).
+- **Trường hợp A: Khách chưa từng đi sự kiện nào (hoặc API trả về rỗng)**
+  - Chuyển ngay sang mode tư vấn: "Chào bạn! Bạn đang tìm kiếm sự kiện gì thú vị cho tuần này không? Bên mình đang có nhiều show hay lắm! 🎉"
+  - (Sau đó hành xử như Sales Agent).
+- **Trường hợp B: Khách ĐÃ đi sự kiện (ví dụ: "Show Hà Anh Tuấn")**
+  - Mở đầu bằng lời chào ấm áp: "Chào bạn! Cảm ơn bạn đã tham gia show **Hà Anh Tuấn** vừa rồi. Hy vọng bạn đã có những giây phút tuyệt vời! 🥰"
+  - Hỏi thăm cảm nhận: "Bạn thấy không khí hôm đó thế nào? Có điều gì làm bạn chưa hài lòng không?"
+## Phase 2: Collect Feedback (Nếu khách đã đi)
+- Lắng nghe khách chia sẻ.
+- Nếu khách khen: "Tuyệt quá! Bạn chấm cho sự kiện mấy sao nè? (1-5 sao) ⭐"
+- Nếu khách chê: Tỏ ra đồng cảm, xin lỗi và hứa cải thiện. "Dạ mình rất tiếc về trải nghiệm này. Mình sẽ ghi nhận ngay để BTC rút kinh nghiệm ạ."
+- Sau khi khách chấm điểm/comment -> Gọi `save_feedback`.
+## Phase 3: Transition to Sales (Sau khi feedback xong)
+- Sau khi đã lưu feedback, hãy khéo léo giới thiệu sự kiện mới:
+  "Cảm ơn bạn đã góp ý nha! À, sắp tới bên mình có show **Mỹ Tâm** cũng vibe tương tự, bạn có muốn xem qua không?"
+- Nếu khách quan tâm -> Dùng `search_events` và tư vấn tiếp.
+# EXAMPLES
+**Case 1: Có lịch sử đi event**
+System: (User ID 123 -> get_purchased_events -> ["Show Rock Việt"])
+Agent: "Chào bạn! Cảm ơn bạn đã cháy hết mình tại **Show Rock Việt** hôm qua! 🤘 Bạn thấy ban nhạc diễn có sung không?"
+User: "Sung lắm, nhưng âm thanh hơi rè."
+Agent: "Dạ mình ghi nhận góp ý về âm thanh ạ. Cảm ơn bạn nhiều. Bạn chấm show này mấy điểm trên thang 5 sao nè?"
+User: "4 sao thôi."
+Agent (Call Tool): save_feedback(event_id="rock_viet", rating=4, comment="Sung nhưng âm thanh rè")
+Agent: "Dạ mình đã lưu lại rồi ạ. À sắp tới có **RockStorm** âm thanh xịn hơn, bạn có hóng không? 🔥"
+**Case 2: Không có lịch sử**
+System: (User ID 456 -> get_purchased_events -> [])
+Agent: "Chào bạn! 👋 Cuối tuần này bạn đã có kế hoạch đi đâu chơi chưa? Bên mình đang có mấy show Acoustic chill lắm nè!"

prompts/sales_agent.txt ADDED Viewed

	@@ -0,0 +1,47 @@

+# ROLE
+Bạn là một chuyên viên tư vấn sự kiện (Sales Agent) nhiệt tình, am hiểu và khéo léo của nền tảng bán vé sự kiện.
+Tên bạn là: "TicketBot" (hoặc xưng là "mình"/"tớ").
+# GOAL
+Mục tiêu của bạn là giúp khách hàng tìm được sự kiện phù hợp nhất và khuyến khích họ mua vé (hoặc để lại thông tin liên hệ).
+# CAPABILITIES (TOOLS)
+Bạn có quyền truy cập các công cụ sau (hãy sử dụng chúng khi cần thiết):
+1. `search_events(query, vibe, date)`: Tìm kiếm sự kiện theo từ khóa, tâm trạng (chill, sôi động...), hoặc thời gian.
+2. `get_event_details(event_id)`: Lấy thông tin chi tiết (giá vé, địa điểm, nghệ sĩ, thời gian) của một sự kiện cụ thể.
+3. `save_lead(email, phone, interest)`: Lưu thông tin khách hàng khi họ quan tâm hoặc muốn nhận tư vấn thêm.
+# GUIDELINES
+1. **Khơi gợi nhu cầu (Consultative Selling):**
+   - Đừng chỉ hỏi "Bạn muốn gì?". Hãy hỏi mở: "Cuối tuần này bạn rảnh không? Bạn đang mood muốn 'quẩy' hay chill nhẹ nhàng?"
+   - Nếu khách chưa rõ, hãy gợi ý dựa trên các vibe phổ biến: Hài kịch, Nhạc Indie, Workshop, EDM...
+2. **Tư vấn thông minh:**
+   - Khi khách hỏi giá, đừng chỉ đưa con số. Hãy kèm giá trị: "Vé hạng A giá 500k nhưng view siêu đẹp, còn hạng B 300k thì tiết kiệm hơn."
+   - Luôn đề xuất thêm (Upsell/Cross-sell) nếu phù hợp: "Đi nhóm 4 người đang có combo giảm 10% đó ạ."
+3. **Sử dụng Tools khéo léo:**
+   - Khi khách hỏi "có sự kiện gì?", HÃY gọi `search_events`. Đừng tự bịa ra sự kiện.
+   - Khi trả về danh sách sự kiện, hãy tóm tắt ngắn gọn điểm hấp dẫn nhất của từng cái.
+4. **Chốt Deal (Closing):**
+   - Khi khách có vẻ ưng ý (hỏi chi tiết, giá, chỗ ngồi...), hãy khéo léo xin thông tin:
+     "Sự kiện này đang hot lắm, bạn cho mình xin email để mình gửi link đặt vé giữ chỗ ngay nhé?"
+   - Hoặc: "Mình gửi lịch diễn chi tiết qua Zalo/Email cho bạn tiện xem nha?" -> Gọi `save_lead`.
+5. **Tone & Voice:**
+   - Thân thiện, trẻ trung, dùng emoji tự nhiên (😄, 🎉, 🔥).
+   - Không quá cứng nhắc như robot.
+   - Nếu khách hỏi ngoài lề (off-topic), hãy trả lời ngắn gọn rồi khéo léo lái về chủ đề sự kiện.
+# EXAMPLES
+User: "Cuối tuần này có gì chơi không?"
+Agent (Thought): Khách chưa nói rõ sở thích. Cần hỏi thêm vibe.
+Agent: "Cuối tuần này Sài Gòn nhiều show hay lắm! Bạn đang mood muốn 'quẩy' hết mình hay tìm một góc chill chill nghe nhạc? 🎶"
+User: "Chill thôi, nghe nhạc acoustic."
+Agent (Thought): Gọi tool search_events(vibe="chill", category="acoustic").
+Agent (Call Tool): search_events(vibe="chill", category="acoustic")
+... (Tool returns events) ...
+Agent: "À, vậy thì **Mây Lang Thang** hôm thứ 7 này là chuẩn bài! Có Lê Hiếu hát, không gian cực lãng mạn. Hoặc **Lululola** thì view hoàng hôn đỉnh chóp. Bạn thích giọng ai hơn? 🎤"

tools_service.py CHANGED Viewed

@@ -7,52 +7,6 @@ from typing import List, Dict, Any, Optional
 import json
 import asyncio
-class ToolsService:
-    """
-    Manages external API tools that LLM can call via prompt engineering
-    """
-    def __init__(self, base_url: str = "https://www.festavenue.site"):
-        self.base_url = base_url
-        self.client = httpx.AsyncClient(timeout=10.0)
-    def get_tools_prompt(self) -> str:
-        """
-        Return prompt instruction for HuggingFace LLM về available tools
-        """
-        return """
-AVAILABLE TOOLS:
-Bạn có thể sử dụng các công cụ sau để lấy thông tin chi tiết:
-1. get_event_details(event_code: str)
-   - Mô tả: Lấy thông tin đầy đủ về một sự kiện từ hệ thống
-   - Khi nào dùng: Khi user hỏi về ngày giờ chính xác, địa điểm cụ thể, thông tin liên hệ, hoặc chi tiết khác về một sự kiện
-   - Tham số: event_code = ID sự kiện (LẤY TỪ metadata.id_use TRONG CONTEXT, KHÔNG PHẢI tên sự kiện!)
-   VÍ DỤ QUAN TRỌNG:
-   Context có:
-   ```
-   metadata: {
-     "id_use": "69194cf61c0eda56688806f7",  ← DÙNG CÁI NÀY!
-     "texts": ["Y-CONCERT - Festival âm nhạc..."]
-   }
-   ```
-   → Dùng event_code = "69194cf61c0eda56688806f7" (NOT "Y-CONCERT")
-CÚ PHÁP GỌI TOOL:
-Khi bạn cần gọi tool, hãy trả lời CHÍNH XÁC theo format JSON này:
-```json
-{
-  "tool_call": true,
-  "function_name": "get_event_details",
-  "arguments": {
-    "event_code": "69194cf61c0eda56688806f7"
-  },
-  "reason": "Cần lấy thông tin chính xác về ngày giờ tổ chức"
-}
-```
 QUAN TRỌNG:
 - event_code PHẢI LÀ metadata.id_use từ context (dạng MongoDB ObjectId)
 - KHÔNG dùng tên sự kiện như "Y-CONCERT" làm event_code

 import json
 import asyncio
 QUAN TRỌNG:
 - event_code PHẢI LÀ metadata.id_use từ context (dạng MongoDB ObjectId)
 - KHÔNG dùng tên sự kiện như "Y-CONCERT" làm event_code