Spaces:

Sakalti
/

Gemi

Build error

Sakalti commited on Jul 2

Commit

56f6207

verified ·

1 Parent(s): 8d3e4d3

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,9 +4,10 @@ from llama_cpp import Llama
 import requests
 from tqdm import tqdm
-# モデルファイルURL（Mistral-Nemo-Japanese-Instruct-2408-GGUF）
 MODEL_URL = "https://huggingface.co/mradermacher/Saka-14B-GGUF/resolve/main/Saka-14B.Q4_K_M.gguf"
-MODEL_PATH = "Saka-14B.Q4_K_M.gguf"
 def download_model(url=MODEL_URL, path=MODEL_PATH):
     os.makedirs(os.path.dirname(path), exist_ok=True)
     if os.path.exists(path):
@@ -27,7 +28,7 @@ def download_model(url=MODEL_URL, path=MODEL_PATH):
             bar.update(size)
     print("モデルのダウンロードが完了しました。")
-# モデルのダウンロード（初回起動時）
 download_model()
 # モデルロード
@@ -56,13 +57,13 @@ def chat_interface(user_input, history, temperature, top_p, max_tokens):
     return history, history
 with gr.Blocks() as demo:
-    gr.Markdown("# Saka GGUF 日本語チャット")
     chatbot = gr.Chatbot()
     user_input = gr.Textbox(placeholder="質問をどうぞ", label="あなたの入力")
     temperature = gr.Slider(minimum=0.0, maximum=1.0, value=0.7, step=0.05, label="Temperature（創造性）")
     top_p = gr.Slider(minimum=0.1, maximum=1.0, value=0.8, step=0.05, label="Top-p（確率の上位何%から生成するか）")
-    max_tokens = gr.Slider(minimum=16, maximum=1024, value=256, step=16, label="最大トークン数")
     history = gr.State([])

 import requests
 from tqdm import tqdm
+# ご自身のモデルURLと保存先パス
 MODEL_URL = "https://huggingface.co/mradermacher/Saka-14B-GGUF/resolve/main/Saka-14B.Q4_K_M.gguf"
+MODEL_PATH = "models/Saka-14B.Q4_K_M.gguf"
 def download_model(url=MODEL_URL, path=MODEL_PATH):
     os.makedirs(os.path.dirname(path), exist_ok=True)
     if os.path.exists(path):
             bar.update(size)
     print("モデルのダウンロードが完了しました。")
+# モデルのダウンロード（初回のみ実行）
 download_model()
 # モデルロード
     return history, history
 with gr.Blocks() as demo:
+    gr.Markdown("# Saka-14B GGUF 日本語チャット")
     chatbot = gr.Chatbot()
     user_input = gr.Textbox(placeholder="質問をどうぞ", label="あなたの入力")
     temperature = gr.Slider(minimum=0.0, maximum=1.0, value=0.7, step=0.05, label="Temperature（創造性）")
     top_p = gr.Slider(minimum=0.1, maximum=1.0, value=0.8, step=0.05, label="Top-p（確率の上位何%から生成するか）")
+    max_tokens = gr.Slider(minimum=16, maximum=2048, value=512, step=16, label="最大トークン数")
     history = gr.State([])