Spaces:

mrfakename
/

Z-Image-Turbo

Running on Zero

multimodalart HF Staff commited on 9 days ago

Commit

4a89237

verified ·

1 Parent(s): e17facd

Update app.py

Files changed (1) hide show

app.py CHANGED Viewed

@@ -2,6 +2,7 @@ import torch
 import spaces
 import gradio as gr
 from diffusers import DiffusionPipeline
 # Load the pipeline once at startup
 print("Loading Z-Image-Turbo pipeline...")
@@ -11,6 +12,16 @@ pipe = DiffusionPipeline.from_pretrained(
     low_cpu_mem_usage=False,
 )
 pipe.to("cuda")
 print("Pipeline loaded!")
 @spaces.GPU

 import spaces
 import gradio as gr
 from diffusers import DiffusionPipeline
+from optimization import optimize_pipeline_
 # Load the pipeline once at startup
 print("Loading Z-Image-Turbo pipeline...")
     low_cpu_mem_usage=False,
 )
 pipe.to("cuda")
+pipe.transformer.set_attention_backend("_flash_3_hub")
+#warmup
+optimize_pipeline_(
+    pipe,
+    prompt="prompt",
+    num_inference_steps=1,
+    guidance_scale=0.0
+)
 print("Pipeline loaded!")
 @spaces.GPU