Spaces:

stepfun-ai
/

Step-Audio-R1

Running

moevis commited on 23 days ago

Commit

8cc91da

1 Parent(s): e9abbb0

更新 LLM 配置，增加 tensor_parallel_size，添加 served_model_name 和 tokenizer_mode

Files changed (1) hide show

app.py CHANGED Viewed

@@ -4,8 +4,10 @@ from vllm import LLM, SamplingParams
 llm = LLM(
     model="stepfun-ai/Step-Audio-2-mini-Think",  # 修改为你需要的模型
     trust_remote_code=True,
-    tensor_parallel_size=2,  # 如果有多张GPU，设置并行数量
     # gpu_memory_utilization=0.9,  # GPU显存利用率
     max_model_len=8192,
 )

 llm = LLM(
     model="stepfun-ai/Step-Audio-2-mini-Think",  # 修改为你需要的模型
     trust_remote_code=True,
+    tensor_parallel_size=4,  # 如果有多张GPU，设置并行数量
     # gpu_memory_utilization=0.9,  # GPU显存利用率
+    served_model_name="step-audio-2-mini-think",
+    tokenizer_mode="step_audio_2",
     max_model_len=8192,
 )