Spaces:

toshas
/

gradio-dualvision

Running

toshas commited on 8 days ago

Commit

9bd6338

1 Parent(s): c5419ae

support heic and heif

add pip freeze and environ printing at the beginning of the demo
add image_utils patch that intercepts large heic images and forces their downsampling

Files changed (4) hide show

app.py +7 -0
gradio_dualvision/app_template.py +9 -1
gradio_dualvision/gradio_patches/image_utils.py +92 -0
requirements.txt +1 -0

app.py CHANGED Viewed

@@ -63,12 +63,19 @@ class ImageFiltersApp(DualVisionApp):
         Process an input image into multiple modalities using the provided arguments or default settings.
         Returns two dictionaries: one containing the modalities and another with the actual settings.
         """
         filter_size = kwargs.get("filter_size", self.DEFAULT_FILTER_SIZE)
         image_out_gray = image_in.convert("L")
         image_out_gaussian = image_in.filter(ImageFilter.GaussianBlur(filter_size // 2))
         image_out_median = image_in.filter(ImageFilter.MedianFilter(filter_size))
         out_modalities = {
             "Gray": image_out_gray,
             "Gaussian": image_out_gaussian,

         Process an input image into multiple modalities using the provided arguments or default settings.
         Returns two dictionaries: one containing the modalities and another with the actual settings.
         """
+        # Downscale the image to 1024px on the longer side
+        scale = min(1.0, 1024 / max(image_in.width, image_in.height))
+        image_in = image_in.resize((round(image_in.width * scale), round(image_in.height * scale)), Image.LANCZOS)
+        # Read settings from kwargs or use default
         filter_size = kwargs.get("filter_size", self.DEFAULT_FILTER_SIZE)
+        # Process the input image in a variety of ways
         image_out_gray = image_in.convert("L")
         image_out_gaussian = image_in.filter(ImageFilter.GaussianBlur(filter_size // 2))
         image_out_median = image_in.filter(ImageFilter.MedianFilter(filter_size))
+        # Return the results and current settings to update the UI
         out_modalities = {
             "Gray": image_out_gray,
             "Gaussian": image_out_gaussian,

gradio_dualvision/app_template.py CHANGED Viewed

@@ -21,11 +21,18 @@
 #   https://github.com/prs-eth/Marigold-DC#-citation
 #   https://github.com/prs-eth/rollingdepth#-citation
 # --------------------------------------------------------------------------
 import glob
 import json
-import os
 import re
 import gradio as gr
 from .version import __version__
@@ -39,6 +46,7 @@ import spaces
 from PIL import Image as PILImage
 from gradio import Component, ImageSlider
 from .gradio_patches.examples import Examples
 from .gradio_patches.gallery import Gallery
 from .gradio_patches.image import Image

 #   https://github.com/prs-eth/Marigold-DC#-citation
 #   https://github.com/prs-eth/rollingdepth#-citation
 # --------------------------------------------------------------------------
+import os
+print("\n".join(f"{k}={v}" for k, v in os.environ.items()))
+os.system("pip freeze")
 import glob
 import json
 import re
+from pi_heif import register_heif_opener
+register_heif_opener()
 import gradio as gr
 from .version import __version__
 from PIL import Image as PILImage
 from gradio import Component, ImageSlider
+from .gradio_patches import image_utils
 from .gradio_patches.examples import Examples
 from .gradio_patches.gallery import Gallery
 from .gradio_patches.image import Image

gradio_dualvision/gradio_patches/image_utils.py ADDED Viewed

	@@ -0,0 +1,92 @@

+from __future__ import annotations
+import warnings
+from pathlib import Path
+from typing import Literal, cast
+import gradio
+from gradio.image_utils import decode_base64_to_file, decode_base64_to_image, decode_base64_to_image_array, format_image
+import numpy as np
+import PIL.Image
+from PIL import ImageOps
+from gradio import processing_utils
+from gradio.data_classes import ImageData
+from gradio.exceptions import Error
+PIL.Image.init()  # fixes https://github.com/gradio-app/gradio/issues/2843 (remove when requiring Pillow 9.4+)
+def patched_preprocess_image(
+    payload: ImageData | None,
+    cache_dir: str,
+    format: str,
+    image_mode: Literal[
+        "1", "L", "P", "RGB", "RGBA", "CMYK", "YCbCr", "LAB", "HSV", "I", "F"
+    ]
+    | None,
+    type: Literal["numpy", "pil", "filepath"],
+) -> np.ndarray | PIL.Image.Image | str | None:
+    if payload is None:
+        return payload
+    if payload.url and payload.url.startswith("data:"):
+        if type == "pil":
+            print("Preprocessing payload as PIL image")
+            return decode_base64_to_image(payload.url)
+        elif type == "numpy":
+            print("Preprocessing payload as numpy array")
+            return decode_base64_to_image_array(payload.url)
+        elif type == "filepath":
+            print("Preprocessing payload as file path")
+            return decode_base64_to_file(payload.url, cache_dir, format)
+    if payload.path is None:
+        raise ValueError("Image path is None.")
+    file_path = Path(payload.path)
+    if payload.orig_name:
+        p = Path(payload.orig_name)
+        name = p.stem
+        suffix = p.suffix.replace(".", "")
+        if suffix in ["jpg", "jpeg"]:
+            suffix = "jpeg"
+    else:
+        name = "image"
+        suffix = "webp"
+    if suffix.lower() == "svg":
+        if type == "filepath":
+            return str(file_path)
+        raise Error("SVG files are not supported as input images for this app.")
+    # Check for heif or heic suffix, treat it as a special case and drop resolution immediately
+    if suffix.lower() in ["heif", "heic"] and type == "filepath":
+        im = PIL.Image.open(file_path).convert("RGB")
+        scale = min(1.0, 1024 / max(im.width, im.height))
+        im = im.resize((round(im.width * scale), round(im.height * scale)), PIL.Image.BILINEAR)
+        file_path = processing_utils.save_pil_to_cache(im, cache_dir=cache_dir)
+    im = PIL.Image.open(file_path)
+    if type == "filepath" and (image_mode in [None, im.mode]):
+        return str(file_path)
+    exif = im.getexif()
+    # 274 is the code for image rotation and 1 means "correct orientation"
+    if exif.get(274, 1) != 1 and hasattr(ImageOps, "exif_transpose"):
+        try:
+            im = ImageOps.exif_transpose(im)
+        except Exception:
+            warnings.warn(f"Failed to transpose image {file_path} based on EXIF data.")
+    if suffix.lower() != "gif" and im is not None:
+        with warnings.catch_warnings():
+            warnings.simplefilter("ignore")
+            if image_mode is not None:
+                im = im.convert(image_mode)
+    return format_image(
+        im,
+        type=cast(Literal["numpy", "pil", "filepath"], type),
+        cache_dir=cache_dir,
+        name=name,
+        format=suffix,
+    )
+gradio.image_utils.preprocess_image = patched_preprocess_image

requirements.txt CHANGED Viewed

@@ -1,3 +1,4 @@
 gradio==5.29.0
 gradio_client==1.10.0
 spaces==0.36.0

 gradio==5.29.0
 gradio_client==1.10.0
+pi_heif==1.1.1
 spaces==0.36.0