Spaces:

mohitk24
/

HW3_Image

Sleeping

App Files Files Community

HW3_Image / app.py

mohitk24

Upload app.py with huggingface_hub

ecec926 verified 3 months ago

raw

history blame contribute delete

3.08 kB

	import os
	import shutil
	import zipfile
	import pathlib
	import tempfile
	import gradio as gr
	import pandas as pd
	import numpy as np
	import PIL.Image
	import huggingface_hub as h
	import autogluon.multimodal

	model_repo_id = "nadakandrew/sign-identification-autogluon"
	zip_filename = "autogluon_image_predictor_dir.zip"
	HF_TOKEN = os.getenv("HF_TOKEN", None)
	cache_dir = pathlib.Path("hf_assets")
	extract_dir = cache_dir / "predictor_native"

	def prepare_predictor_dir():
	cache_dir.mkdir(parents=True, exist_ok=True)
	local_zip = h.hf_hub_download(
	repo_id=model_repo_id,
	filename=zip_filename,
	repo_type="model",
	token=HF_TOKEN,
	local_dir=str(cache_dir),
	local_dir_use_symlinks=False,
	)
	if extract_dir.exists():
	shutil.rmtree(extract_dir)
	extract_dir.mkdir(parents=True, exist_ok=True)
	with zipfile.ZipFile(local_zip, "r") as zf:
	zf.extractall(str(extract_dir))
	contents = list(extract_dir.iterdir())
	predictor_root = contents[0] if (len(contents) == 1 and contents[0].is_dir()) else extract_dir
	return str(predictor_root)

	predictor_dir = prepare_predictor_dir()
	predictor = autogluon.multimodal.MultiModalPredictor.load(predictor_dir)

	def do_predict(pil_img, preprocess=True):
	if pil_img is None:
	return "No image provided.", None, None

	original_img = pil_img.copy()
	preprocessed_img = None

	if preprocess:
	target_size = (224, 224)
	preprocessed_img = pil_img.resize(target_size).convert("RGB")
	tmpdir = pathlib.Path(tempfile.mkdtemp())
	img_path = tmpdir / "input.png"
	preprocessed_img.save(img_path)
	else:
	tmpdir = pathlib.Path(tempfile.mkdtemp())
	img_path = tmpdir / "input.png"
	pil_img.save(img_path)

	df = pd.DataFrame({"image": [str(img_path)]})
	proba_df = predictor.predict_proba(df)
	proba_df = proba_df.rename(columns={0: "class_0", 1: "class_1"})
	row = proba_df.iloc[0]

	pretty_dict = {
	"Not a STOP sign": float(row.get("class_0", 0.0)),
	"STOP sign": float(row.get("class_1", 0.0)),
	}

	return pretty_dict, original_img, preprocessed_img

	# Remove external URLs - use local examples or none
	with gr.Blocks() as demo:
	gr.Markdown("# Is this a STOP sign or not?")
	gr.Markdown("Upload a photo to see results.")

	with gr.Row():
	image_in = gr.Image(type="pil", label="Input image", sources=["upload", "webcam"])
	original_img_out = gr.Image(type="pil", label="Original image")
	preprocessed_img_out = gr.Image(type="pil", label="Preprocessed image")

	with gr.Row():
	preprocess_checkbox = gr.Checkbox(label="Apply Preprocessing", value=True)

	proba_pretty = gr.Label(num_top_classes=2, label="Class probabilities")

	image_in.change(
	fn=do_predict,
	inputs=[image_in, preprocess_checkbox],
	outputs=[proba_pretty, original_img_out, preprocessed_img_out]
	)

	# No examples with external URLs to avoid connection errors

	if __name__ == "__main__":
	demo.launch()