Spaces:

KiWA001
/

kai-api-gateway

Running

KiWA001 commited on 4 days ago

Commit

1d9fca9

1 Parent(s): e8c0ba8

Replace HuggingChat with HuggingFace Widget Provider

- Add new HuggingFace Widget provider using mini chat interface
- Persistent browser session (no restart between requests)
- Top 10 models as Tier 1 priority:
* MiniMaxAI/MiniMax-M2.5
* moonshotai/Kimi-K2.5
* zai-org/GLM-5
* meta-llama/Llama-4-Scout/Maverick
* meta-llama/Llama-3.3-70B
* deepseek-ai/DeepSeek-V3
* Qwen/Qwen3-32B & Qwen2.5-72B
* microsoft/Phi-4
- Faster response times by reusing browser context
- Same HF credentials (one@bo5.store)

Files changed (3) hide show

config.py +29 -5
engine.py +5 -5
providers/huggingface_widget_provider.py +418 -0

config.py CHANGED Viewed

@@ -14,25 +14,37 @@ Exhaustively tries ALL combinations before giving up.
 # Examples: huggingchat-llama-3.3-70b, zai-glm-5, g4f-gpt-4, gemini-gemini-3-flash
 # -------------------------------------------------------------------
 MODEL_RANKING = [
-    # Tier 1 — Verified Working Models (Best Quality)
     ("g4f-gpt-4", "g4f", "gpt-4"),
     ("g4f-gpt-4o-mini", "g4f", "gpt-4o-mini"),
     ("zai-glm-5", "zai", "glm-5"),
     ("gemini-gemini-3-flash", "gemini", "gemini-3-flash"),
-    # Tier 2 — Pollinations
     ("pollinations-gpt-oss-20b", "pollinations", "openai"),
     ("pollinations-mistral-small-3.2", "pollinations", "mistral"),
     ("pollinations-bidara", "pollinations", "bidara"),
     ("pollinations-chickytutor", "pollinations", "chickytutor"),
     ("pollinations-midijourney", "pollinations", "midijourney"),
-    # Tier 3 — G4F Fallback Models
     ("g4f-gpt-3.5-turbo", "g4f", "gpt-3.5-turbo"),
     ("g4f-claude-3-haiku", "g4f", "claude-3-haiku"),
     ("g4f-mixtral-8x7b", "g4f", "mixtral-8x7b"),
-    # Tier 4 — OpenCode Terminal Models (Free)
     ("opencode-kimi-k2.5-free", "opencode", "kimi-k2.5-free"),
     ("opencode-minimax-m2.5-free", "opencode", "minimax-m2.5-free"),
     ("opencode-big-pickle", "opencode", "big-pickle"),
@@ -75,7 +87,7 @@ PROVIDERS = {
     "zai": {"enabled": True, "name": "Z.ai (GLM-5)", "type": "api"},
     "gemini": {"enabled": True, "name": "Google Gemini", "type": "api"},
     "pollinations": {"enabled": True, "name": "Pollinations", "type": "api"},
-    "huggingchat": {"enabled": True, "name": "HuggingChat", "type": "browser"},
     "copilot": {"enabled": False, "name": "Microsoft Copilot", "type": "browser"},
     "chatgpt": {"enabled": False, "name": "ChatGPT", "type": "browser"},
     "opencode": {"enabled": False, "name": "OpenCode Terminal", "type": "terminal"},
@@ -87,6 +99,18 @@ DEMO_API_KEY = "sk-kai-demo-public"
 # Models per provider (for /models endpoint)
 # All names follow the pattern: {provider}-{model-name}
 PROVIDER_MODELS = {
     "g4f": [
         "g4f-gpt-4",
         "g4f-gpt-4o-mini",

 # Examples: huggingchat-llama-3.3-70b, zai-glm-5, g4f-gpt-4, gemini-gemini-3-flash
 # -------------------------------------------------------------------
 MODEL_RANKING = [
+    # Tier 1 — Top Hugging Face Models (Best Quality via Widget)
+    ("hf-kimi-k2.5", "huggingface_widget", "hf-kimi-k2.5"),
+    ("hf-minimax-m2.5", "huggingface_widget", "hf-minimax-m2.5"),
+    ("hf-glm-5", "huggingface_widget", "hf-glm-5"),
+    ("hf-llama-4-scout", "huggingface_widget", "hf-llama-4-scout"),
+    ("hf-llama-4-maverick", "huggingface_widget", "hf-llama-4-maverick"),
+    ("hf-llama-3.3-70b", "huggingface_widget", "hf-llama-3.3-70b"),
+    ("hf-deepseek-v3", "huggingface_widget", "hf-deepseek-v3"),
+    ("hf-qwen3-32b", "huggingface_widget", "hf-qwen3-32b"),
+    ("hf-qwen2.5-72b", "huggingface_widget", "hf-qwen2.5-72b"),
+    ("hf-phi-4", "huggingface_widget", "hf-phi-4"),
+    # Tier 2 — Other Providers
     ("g4f-gpt-4", "g4f", "gpt-4"),
     ("g4f-gpt-4o-mini", "g4f", "gpt-4o-mini"),
     ("zai-glm-5", "zai", "glm-5"),
     ("gemini-gemini-3-flash", "gemini", "gemini-3-flash"),
+    # Tier 3 — Pollinations
     ("pollinations-gpt-oss-20b", "pollinations", "openai"),
     ("pollinations-mistral-small-3.2", "pollinations", "mistral"),
     ("pollinations-bidara", "pollinations", "bidara"),
     ("pollinations-chickytutor", "pollinations", "chickytutor"),
     ("pollinations-midijourney", "pollinations", "midijourney"),
+    # Tier 4 — G4F Fallback Models
     ("g4f-gpt-3.5-turbo", "g4f", "gpt-3.5-turbo"),
     ("g4f-claude-3-haiku", "g4f", "claude-3-haiku"),
     ("g4f-mixtral-8x7b", "g4f", "mixtral-8x7b"),
+    # Tier 5 — OpenCode Terminal Models (Free)
     ("opencode-kimi-k2.5-free", "opencode", "kimi-k2.5-free"),
     ("opencode-minimax-m2.5-free", "opencode", "minimax-m2.5-free"),
     ("opencode-big-pickle", "opencode", "big-pickle"),
     "zai": {"enabled": True, "name": "Z.ai (GLM-5)", "type": "api"},
     "gemini": {"enabled": True, "name": "Google Gemini", "type": "api"},
     "pollinations": {"enabled": True, "name": "Pollinations", "type": "api"},
+    "huggingface_widget": {"enabled": True, "name": "Hugging Face Widget", "type": "browser"},
     "copilot": {"enabled": False, "name": "Microsoft Copilot", "type": "browser"},
     "chatgpt": {"enabled": False, "name": "ChatGPT", "type": "browser"},
     "opencode": {"enabled": False, "name": "OpenCode Terminal", "type": "terminal"},
 # Models per provider (for /models endpoint)
 # All names follow the pattern: {provider}-{model-name}
 PROVIDER_MODELS = {
+    "huggingface_widget": [
+        "hf-kimi-k2.5",
+        "hf-minimax-m2.5",
+        "hf-glm-5",
+        "hf-llama-4-scout",
+        "hf-llama-4-maverick",
+        "hf-llama-3.3-70b",
+        "hf-deepseek-v3",
+        "hf-qwen3-32b",
+        "hf-qwen2.5-72b",
+        "hf-phi-4",
+    ],
     "g4f": [
         "g4f-gpt-4",
         "g4f-gpt-4o-mini",

engine.py CHANGED Viewed

@@ -19,7 +19,7 @@ from providers.g4f_provider import G4FProvider
 from providers.pollinations_provider import PollinationsProvider
 from providers.gemini_provider import GeminiProvider
 from providers.zai_provider import ZaiProvider
-from providers.huggingchat_provider import HuggingChatProvider
 from providers.copilot_provider import CopilotProvider
 from providers.opencode_provider import OpenCodeProvider
 from config import MODEL_RANKING, PROVIDER_MODELS, SUPABASE_URL, SUPABASE_KEY
@@ -61,15 +61,15 @@ class AIEngine:
             self._providers["gemini"] = GeminiProvider()
             logger.info("✅ Gemini provider enabled")
-            # HuggingChat also uses Playwright
-            self._providers["huggingchat"] = HuggingChatProvider()
-            logger.info("✅ HuggingChat provider enabled")
             # Copilot also uses Playwright (with CAPTCHA support)
             self._providers["copilot"] = CopilotProvider()
             logger.info("✅ Copilot provider enabled (with CAPTCHA support)")
         else:
-            logger.warning("⚠️ Z.ai/Gemini/HuggingChat/Copilot providers disabled (Playwright not installed)")
         # Success Tracker: Key = "provider/model_id"
         # Value = {success, failure, consecutive_failures, avg_time_ms, total_time_ms, count_samples}
         self._stats: dict[str, dict] = {}

 from providers.pollinations_provider import PollinationsProvider
 from providers.gemini_provider import GeminiProvider
 from providers.zai_provider import ZaiProvider
+from providers.huggingface_widget_provider import HuggingFaceWidgetProvider
 from providers.copilot_provider import CopilotProvider
 from providers.opencode_provider import OpenCodeProvider
 from config import MODEL_RANKING, PROVIDER_MODELS, SUPABASE_URL, SUPABASE_KEY
             self._providers["gemini"] = GeminiProvider()
             logger.info("✅ Gemini provider enabled")
+            # HuggingFace Widget also uses Playwright
+            self._providers["huggingface_widget"] = HuggingFaceWidgetProvider()
+            logger.info("✅ HuggingFace Widget provider enabled")
             # Copilot also uses Playwright (with CAPTCHA support)
             self._providers["copilot"] = CopilotProvider()
             logger.info("✅ Copilot provider enabled (with CAPTCHA support)")
         else:
+            logger.warning("⚠️ Z.ai/Gemini/HuggingFace Widget/Copilot providers disabled (Playwright not installed)")
         # Success Tracker: Key = "provider/model_id"
         # Value = {success, failure, consecutive_failures, avg_time_ms, total_time_ms, count_samples}
         self._stats: dict[str, dict] = {}

providers/huggingface_widget_provider.py ADDED Viewed

	@@ -0,0 +1,418 @@

+"""
+Hugging Face Widget Provider (Mini Chat)
+----------------------------------------
+Uses Playwright to interact with the mini chat widget on Hugging Face model pages.
+Much faster than HuggingChat as it uses the embedded inference widget.
+Strategy:
+- Single persistent browser instance
+- Navigate to model page and use the mini chat widget
+- Start new chat by clearing/refreshing the widget
+- Supports 10+ popular models
+"""
+import asyncio
+import logging
+import re
+from typing import Optional
+from providers.base import BaseProvider
+from config import PROVIDER_MODELS
+logger = logging.getLogger("kai_api.huggingface_widget")
+_playwright = None
+_browser = None
+_context = None
+_lock = asyncio.Lock()
+# Hugging Face credentials (same as HuggingChat)
+HF_USERNAME = "one@bo5.store"
+HF_PASSWORD = "Zzzzz1$."
+# Top 10+ Popular models with their HF paths
+POPULAR_MODELS = {
+    # Tier 1 - Most Popular
+    "hf-kimi-k2.5": "moonshotai/Kimi-K2.5",
+    "hf-minimax-m2.5": "MiniMaxAI/MiniMax-M2.5",
+    "hf-glm-5": "zai-org/GLM-5",
+    "hf-llama-4-scout": "meta-llama/Llama-4-Scout-17B-16E-Instruct",
+    "hf-llama-4-maverick": "meta-llama/Llama-4-Maverick-17B-128E-Instruct",
+    "hf-llama-3.3-70b": "meta-llama/Llama-3.3-70B-Instruct",
+    "hf-deepseek-v3": "deepseek-ai/DeepSeek-V3",
+    "hf-qwen3-32b": "Qwen/Qwen3-32B",
+    "hf-qwen2.5-72b": "Qwen/Qwen2.5-72B-Instruct",
+    "hf-phi-4": "microsoft/Phi-4",
+}
+class HuggingFaceWidgetProvider(BaseProvider):
+    """AI provider using Hugging Face model mini chat widgets."""
+    RESPONSE_TIMEOUT = 60
+    HYDRATION_DELAY = 1.5
+    @property
+    def name(self) -> str:
+        return "huggingface_widget"
+    def get_available_models(self) -> list[str]:
+        return list(POPULAR_MODELS.keys())
+    @staticmethod
+    def is_available() -> bool:
+        """Check if Playwright is installed."""
+        try:
+            from playwright.async_api import async_playwright
+            return True
+        except ImportError:
+            return False
+    async def _ensure_browser(self):
+        """Start persistent browser and context if not running."""
+        global _playwright, _browser, _context
+        async with _lock:
+            if _browser and _browser.is_connected():
+                return
+            logger.info("🚀 HuggingFace Widget: Launching browser...")
+            from playwright.async_api import async_playwright
+            _playwright = await async_playwright().start()
+            _browser = await _playwright.chromium.launch(
+                headless=True,
+                args=[
+                    "--disable-blink-features=AutomationControlled",
+                    "--no-sandbox",
+                    "--disable-dev-shm-usage",
+                    "--disable-gpu",
+                ],
+            )
+            # Create persistent context (cookies persist across requests)
+            _context = await _browser.new_context(
+                viewport={"width": 1920, "height": 1080},
+                user_agent="Mozilla/5.0 (Macintosh; Intel Mac OS X 10_15_7) "
+                           "AppleWebKit/537.36 (KHTML, like Gecko) "
+                           "Chrome/120.0.0.0 Safari/537.36",
+                locale="en-US",
+            )
+            # Hide webdriver
+            await _context.add_init_script("""
+                Object.defineProperty(navigator, 'webdriver', {get: () => undefined});
+            """)
+            logger.info("✅ HuggingFace Widget: Browser ready")
+    async def _ensure_logged_in(self):
+        """Check if logged in, if not perform login."""
+        global _context
+        page = await _context.new_page()
+        try:
+            # Check if we're logged in by going to a model page
+            await page.goto("https://huggingface.co/meta-llama/Llama-3.3-70B-Instruct", timeout=30000)
+            await asyncio.sleep(1)
+            # Check for login button
+            login_btn = await page.query_selector('a[href*="login"], button:has-text("Log in")')
+            if login_btn:
+                logger.info("HF Widget: Not logged in, performing login...")
+                await self._perform_login()
+            else:
+                logger.info("HF Widget: Already logged in")
+        except Exception as e:
+            logger.warning(f"HF Widget: Login check failed: {e}")
+        finally:
+            await page.close()
+    async def _perform_login(self):
+        """Login to Hugging Face."""
+        global _context
+        page = await _context.new_page()
+        try:
+            logger.info("HF Widget: Logging in...")
+            await page.goto("https://huggingface.co/login", timeout=60000)
+            # Fill credentials
+            await page.wait_for_selector('input[name="username"]', timeout=10000)
+            await page.fill('input[name="username"]', HF_USERNAME)
+            await asyncio.sleep(0.3)
+            await page.fill('input[name="password"]', HF_PASSWORD)
+            await asyncio.sleep(0.3)
+            # Submit
+            await page.click('button[type="submit"]')
+            # Wait for redirect
+            try:
+                await page.wait_for_url(lambda url: "login" not in url, timeout=15000)
+                logger.info("✅ HF Widget: Login successful")
+            except:
+                current_url = page.url
+                if "login" in current_url:
+                    logger.error("❌ HF Widget: Login failed")
+                    raise RuntimeError("Failed to login to Hugging Face")
+        finally:
+            await page.close()
+    async def send_message(
+        self,
+        prompt: str,
+        model: str | None = None,
+        system_prompt: str | None = None,
+        **kwargs,
+    ) -> dict:
+        """Send message via Hugging Face model widget."""
+        if not self.is_available():
+            raise RuntimeError("Playwright not installed")
+        await self._ensure_browser()
+        await self._ensure_logged_in()
+        global _context
+        # Get model path
+        selected_model = model or "hf-kimi-k2.5"
+        model_path = POPULAR_MODELS.get(selected_model, selected_model.replace("hf-", ""))
+        if selected_model not in POPULAR_MODELS:
+            selected_model = "hf-kimi-k2.5"
+            model_path = POPULAR_MODELS[selected_model]
+        logger.info(f"HF Widget request: {selected_model} ({model_path})")
+        page = await _context.new_page()
+        try:
+            # Navigate to model page
+            url = f"https://huggingface.co/{model_path}"
+            await page.goto(url, timeout=60000)
+            await asyncio.sleep(self.HYDRATION_DELAY)
+            # Handle cookie consent if present
+            try:
+                cookie_btn = await page.wait_for_selector(
+                    'button:has-text("Accept"), button:has-text("I agree")',
+                    timeout=3000
+                )
+                if cookie_btn:
+                    await cookie_btn.click()
+                    await asyncio.sleep(0.5)
+            except:
+                pass
+            # Find the mini chat widget input
+            # Try multiple selectors for different widget versions
+            input_selectors = [
+                '[data-target="WidgetChatInput"] textarea',
+                '.inference-widget textarea',
+                '[data-target="InferenceWidget"] textarea',
+                'textarea[placeholder*="chat"]',
+                'textarea[placeholder*="message"]',
+                '.widget-container textarea',
+                '[class*="chat-input"] textarea',
+            ]
+            input_selector = None
+            for sel in input_selectors:
+                try:
+                    el = await page.wait_for_selector(sel, timeout=2000)
+                    if el:
+                        input_selector = sel
+                        logger.info(f"HF Widget: Found input using {sel}")
+                        break
+                except:
+                    continue
+            if not input_selector:
+                # Try to scroll to find the widget
+                await page.evaluate("window.scrollTo(0, document.body.scrollHeight * 0.3)")
+                await asyncio.sleep(1)
+                # Try again
+                for sel in input_selectors:
+                    try:
+                        el = await page.wait_for_selector(sel, timeout=3000)
+                        if el:
+                            input_selector = sel
+                            break
+                    except:
+                        continue
+            if not input_selector:
+                raise RuntimeError("Could not find chat widget input")
+            # Clear any existing conversation (start fresh)
+            await self._clear_chat(page)
+            # Type message
+            full_prompt = prompt
+            if system_prompt:
+                full_prompt = f"[System: {system_prompt}]\n\n{prompt}"
+            await page.fill(input_selector, full_prompt)
+            await asyncio.sleep(0.3)
+            # Submit (usually Enter key)
+            await page.keyboard.press("Enter")
+            logger.info("HF Widget: Message sent, waiting for response...")
+            # Wait for response
+            response_text = await self._wait_for_response(page)
+            if not response_text:
+                raise ValueError("Empty response from model")
+            logger.info(f"HF Widget: Got response ({len(response_text)} chars)")
+            return {
+                "response": response_text,
+                "model": selected_model,
+            }
+        except Exception as e:
+            logger.error(f"HF Widget Error: {e}")
+            raise
+        finally:
+            await page.close()
+    async def _clear_chat(self, page):
+        """Clear existing chat to start fresh conversation."""
+        try:
+            # Look for clear/new chat button
+            clear_selectors = [
+                'button:has-text("Clear")',
+                'button:has-text("New")',
+                'button:has-text("Reset")',
+                '[data-target="ClearChat"]',
+                '[class*="clear-chat"]',
+            ]
+            for sel in clear_selectors:
+                try:
+                    btn = await page.wait_for_selector(sel, timeout=2000)
+                    if btn:
+                        await btn.click()
+                        logger.info("HF Widget: Cleared previous chat")
+                        await asyncio.sleep(0.5)
+                        return
+                except:
+                    continue
+            # If no clear button, refresh the page to start fresh
+            logger.info("HF Widget: Refreshing page for new chat")
+            await page.reload()
+            await asyncio.sleep(1.5)
+        except Exception as e:
+            logger.warning(f"HF Widget: Could not clear chat: {e}")
+    async def _wait_for_response(self, page) -> str:
+        """Wait for and extract response from widget."""
+        last_text = ""
+        stable_count = 0
+        required_stable = 2
+        for i in range(self.RESPONSE_TIMEOUT * 2):
+            await asyncio.sleep(0.5)
+            # Check if still loading/generating
+            is_loading = await page.evaluate("""
+                () => {
+                    const loading = document.querySelectorAll(
+                        '[class*="loading"], [class*="spinner"], [class*="animate-pulse"], ' +
+                        '[data-loading="true"], .generating'
+                    );
+                    return loading.length > 0;
+                }
+            """)
+            if is_loading:
+                continue
+            # Extract response text
+            current_text = await page.evaluate("""
+                () => {
+                    // Try different selectors for the assistant response
+                    const selectors = [
+                        '[data-target="WidgetMessage"][data-role="assistant"]',
+                        '.widget-message.assistant',
+                        '[data-role="assistant"] .message-content',
+                        '.inference-widget [data-message-role="assistant"]',
+                        '.chat-message.assistant',
+                        '[class*="assistant"] [class*="content"]',
+                        '.widget-container .response',
+                    ];
+                    for (const sel of selectors) {
+                        const els = document.querySelectorAll(sel);
+                        if (els.length > 0) {
+                            // Get the last response
+                            const last = els[els.length - 1];
+                            const text = last.innerText || last.textContent || '';
+                            if (text.trim().length > 5) return text.trim();
+                        }
+                    }
+                    // Fallback: look for any non-user message
+                    const allMessages = document.querySelectorAll('.message, .chat-message, [class*="message"]');
+                    for (const msg of allMessages) {
+                        const isUser = msg.classList.contains('user') ||
+                                      msg.getAttribute('data-role') === 'user' ||
+                                      msg.querySelector('.user');
+                        if (!isUser) {
+                            const text = msg.innerText || msg.textContent || '';
+                            if (text.trim().length > 10) return text.trim();
+                        }
+                    }
+                    return '';
+                }
+            """)
+            if not current_text:
+                continue
+            clean = self._clean_response(current_text)
+            if clean == last_text and len(clean) > 10:
+                stable_count += 1
+                if stable_count >= required_stable:
+                    return clean
+            else:
+                stable_count = 0
+                last_text = clean
+            if i % 10 == 9:
+                logger.info(f"HF Widget: Streaming... {len(last_text)} chars")
+        if last_text:
+            logger.warning("HF Widget: Timeout, returning partial response")
+            return last_text
+        raise TimeoutError("No response from model")
+    def _clean_response(self, text: str) -> str:
+        """Clean up response text."""
+        clean = text.strip()
+        # Remove common artifacts
+        clean = re.sub(r"\n+\s*\n+", "\n\n", clean)
+        clean = re.sub(r"^User:\s*", "", clean, flags=re.IGNORECASE)
+        clean = re.sub(r"^Assistant:\s*", "", clean, flags=re.IGNORECASE)
+        return clean.strip()
+    async def health_check(self) -> bool:
+        """Quick health check."""
+        try:
+            if not self.is_available():
+                return False
+            await self._ensure_browser()
+            return _browser.is_connected()
+        except Exception:
+            return False