Spaces:

yogies
/

cpschat

Running

App Files Files

yogies commited on Sep 29

Commit

58db5f4

verified ·

1 Parent(s): 5d2024e

Update app.py

Browse files

Files changed (1) hide show

app.py +68 -25

app.py CHANGED Viewed

@@ -54,6 +54,7 @@ MODELS = {
         "provider": "openrouter",
         "model_name": "nvidia/nemotron-nano-9b-v2:free",
         "api_url": "https://openrouter.ai/api/v1",
     },
     # "Ringan - Gemma-3n4b": {
     #     "provider": "openrouter",
@@ -63,17 +64,20 @@ MODELS = {
     # "Gpt-oss-20b": {
     #     "provider": "openrouter",
     #     "model_name": "openai/gpt-oss-20b:floor",
-    #     "api_url": "https://openrouter.ai/api/v1"
     # },
     "Tongyi-deepresearch-30b-a3b": {
         "provider": "openrouter",
         "model_name": "alibaba/tongyi-deepresearch-30b-a3b:floor",
-        "api_url": "https://openrouter.ai/api/v1"
     }
     # "Kompleks - Gpt-oss-120b": {
     #     "provider": "openrouter",
     #     "model_name": "openai/gpt-oss-120b:floor",
-    #     "api_url": "https://openrouter.ai/api/v1"
     # }
 }
@@ -91,15 +95,11 @@ def respond(
     selected_model,
 ):
     """
-    Handle chat responses using the selected model
     """
     try:
-        # Check expiration (optional - remove if not needed)
-        # end_date = datetime.strptime(_secret("END_DATE", "2026-12-31"), "%Y-%m-%d").date()
-        # if date.today() > end_date:
-        #     yield "Chatbot has expired."
-        #     return
         # Get model configuration
         model_config = MODELS[selected_model]
         provider = model_config["provider"]
@@ -110,36 +110,79 @@ def respond(
         else:  # openrouter
             api_key = _secret("OPENROUTER_KEY")
-        # Configure client
         client = OpenAI(
             base_url=model_config["api_url"],
             api_key=api_key,
         )
-        # Prepare messages
-        messages = [{"role": "system", "content": system_message}]
-        messages.extend(history)
-        messages.append({"role": "user", "content": message})
-        # Make the API call with streaming
         response = client.chat.completions.create(
             model=model_config["model_name"],
             messages=messages,
             max_tokens=max_tokens,
-            stream=True,
         )
-        # Accumulate and yield incrementally for smooth streaming
-        full_response = ""
-        for chunk in response:
-            if chunk.choices[0].delta.content is not None:
-                content = chunk.choices[0].delta.content
-                full_response += content
-                yield full_response
     except Exception as e:
         print(f"Error in respond function: {e}")
-        yield f"Error: {str(e)}"
 # ----------------------------------------------------------------------
 # Custom Auth Function for Gradio

         "provider": "openrouter",
         "model_name": "nvidia/nemotron-nano-9b-v2:free",
         "api_url": "https://openrouter.ai/api/v1",
+        "translate":"yes"
     },
     # "Ringan - Gemma-3n4b": {
     #     "provider": "openrouter",
     # "Gpt-oss-20b": {
     #     "provider": "openrouter",
     #     "model_name": "openai/gpt-oss-20b:floor",
+    #     "api_url": "https://openrouter.ai/api/v1",
+    #     "translate":"no"
     # },
     "Tongyi-deepresearch-30b-a3b": {
         "provider": "openrouter",
         "model_name": "alibaba/tongyi-deepresearch-30b-a3b:floor",
+        "api_url": "https://openrouter.ai/api/v1",
+        "translate":"no"
     }
     # "Kompleks - Gpt-oss-120b": {
     #     "provider": "openrouter",
     #     "model_name": "openai/gpt-oss-120b:floor",
+    #     "api_url": "https://openrouter.ai/api/v1",
+    #     "translate":"no"
     # }
 }
     selected_model,
 ):
     """
+    Handle chat responses using the selected model.
+    For 'translate'=='yes': First call responds in English, second translates to Indonesian.
+    History reflects Indonesian queries and responses.
     """
     try:
         # Get model configuration
         model_config = MODELS[selected_model]
         provider = model_config["provider"]
         else:  # openrouter
             api_key = _secret("OPENROUTER_KEY")
+        # Configure main client for selected model
         client = OpenAI(
             base_url=model_config["api_url"],
             api_key=api_key,
         )
+        # Configure translator client (always Gemma on OpenRouter)
+        translator_client = OpenAI(
+            base_url="https://openrouter.ai/api/v1",
+            api_key=_secret("OPENROUTER_KEY"),
+        )
+        # Modify system message to force English response if translate=yes
+        if model_config.get("translate") == "yes":
+            final_system_message = "**HIGHEST PRIORITY: YOU MUST ALWAYS THINK AND RESPOND IN ENGLISH REGARDLESS OF OTHER INSTRUCTIONS FROM HERE ON.\n" + system_message
+        else:
+            final_system_message = system_message
+        # Prepare messages for main API call (full history + current message)
+        messages = [{"role": "system", "content": final_system_message}]
+        messages.extend(history)  # History: Indo queries + prior Indo responses
+        messages.append({"role": "user", "content": message})  # New Indo query
+        # First API call: Get response from selected model (English if translate=yes)
         response = client.chat.completions.create(
             model=model_config["model_name"],
             messages=messages,
             max_tokens=max_tokens,
+            stream=False,
         )
+        english_response = response.choices[0].message.content
+        # If translate=yes, make second API call to Gemma for Indonesian translation
+        if model_config.get("translate") == "yes":
+            try:
+                # Translation prompt: Focus only on translating the response (not query)
+                translation_messages = [
+                    {
+                        "role": "system",
+                        "content": (
+                            "Translate the following English text to natural, accurate Bahasa Indonesia. "
+                            "**IMPORTANT: OUTPUT ONLY THE TRANSLATION. NO PREAMBLES, COMMENTS, OR EXPLANATIONS. "
+                            "Just the Indonesian text."
+                        )
+                    },
+                    {
+                        "role": "user",
+                        "content": english_response  # The English response to translate
+                    }
+                ]
+                translation_response = translator_client.chat.completions.create(
+                    model="google/gemma-3n-e4b-it:floor",
+                    messages=translation_messages,
+                    max_tokens=max_tokens,  # Reuse limit; translation is short
+                    stream=False,
+                )
+                final_response = translation_response.choices[0].message.content.strip()
+                # Fallback to English if translation is empty or invalid
+                if not final_response or len(final_response) < 10:  # Basic sanity check
+                    final_response = english_response
+            except Exception as trans_error:
+                print(f"Translation error: {trans_error}")
+                final_response = english_response  # Fallback to English
+        else:
+            final_response = english_response
+        return final_response  # Gradio appends this (Indonesian) as assistant message to history
     except Exception as e:
         print(f"Error in respond function: {e}")
+        return f"Error: {str(e)}"  # Return error string; Gradio appends it
 # ----------------------------------------------------------------------
 # Custom Auth Function for Gradio