Spaces:

GerardCB
/

GeoQuery

Running

App Files Files Community

GerardCB commited on 4 days ago

Commit

db450fb

1 Parent(s): 6414190

Fix: Remove build-time download script

Browse files

Files changed (1) hide show

backend/scripts/download_hdx_panama.py +0 -105

backend/scripts/download_hdx_panama.py DELETED Viewed

@@ -1,105 +0,0 @@
-#!/usr/bin/env python3
-"""
-Download Panama-specific datasets from HDX
-"""
-import requests
-import geopandas as gpd
-from pathlib import Path
-import logging
-import zipfile
-import io
-logging.basicConfig(level=logging.INFO)
-logger = logging.getLogger(__name__)
-DATA_DIR = Path(__file__).parent.parent / "data" / "hdx"
-# HDX Dataset URLs (Panama-specific)
-HDX_DATASETS = {
-    "waterways": {
-        "url": "https://data.humdata.org/dataset/9b925ead-6034-4ce8-92d9-45d3a1ece1fc/resource/e0dd9e95-5b04-4a5c-b7ef-31a2ea046e1c/download/hotosm_pan_waterways_lines_geojson.zip",
-        "description": "Panama Waterways from OpenStreetMap"
-    },
-    "road_surface": {
-        "url": "https://data.humdata.org/dataset/c55bf26a-eba6-402d-b004-8c4af8c24b39/resource/c03fa6cc-e698-4c10-8b05-77de91e13e86/download/panama_roads.geojson",
-        "description": "Panama Road Surface Data (AI-predicted paved/unpaved)"
-    },
-    "admin_3": {
-        "url": "https://data.humdata.org/dataset/d188544c-352b-419b-a489-0ae6b763bf21/resource/119d6756-749e-4e4f-bf3a-9694ce22df0a/download/pan_admin3_2021.geojson",
-        "description": "Panama Admin 3 (Corregimientos) Boundaries"
-    },
-    "admin_lines": {
-         "url": "https://data.humdata.org/dataset/d188544c-352b-419b-a489-0ae6b763bf21/resource/d7981358-867c-4034-aa1e-07d0f419c968/download/pan_admin_lines_2021.geojson",
-         "description": "Panama Admin Lines"
-    }
-}
-def download_and_extract_hdx(dataset_name, url, description):
-    """Download and extract HDX dataset"""
-    logger.info(f"Downloading {description}...")
-    output_dir = DATA_DIR / dataset_name
-    output_dir.mkdir(parents=True, exist_ok=True)
-    try:
-        response = requests.get(url, timeout=60)
-        response.raise_for_status()
-        # Check if ZIP or direct GeoJSON
-        if url.endswith('.zip'):
-            # Extract ZIP
-            with zipfile.ZipFile(io.BytesIO(response.content)) as z:
-                z.extractall(output_dir)
-                logger.info(f"Extracted ZIP to {output_dir}")
-                # Find GeoJSON file
-                geojson_files = list(output_dir.glob("*.geojson"))
-                if geojson_files:
-                    geojson_path = geojson_files[0]
-                    gdf = gpd.read_file(geojson_path)
-                    logger.info(f"Loaded {len(gdf)} features from {geojson_path.name}")
-                    return geojson_path, len(gdf)
-        else:
-            # Direct GeoJSON
-            if dataset_name == "admin_3":
-                 output_dir = DATA_DIR.parent / "base"
-                 geojson_path = output_dir / "pan_admin3.geojson"
-            elif dataset_name == "admin_lines":
-                 output_dir = DATA_DIR.parent / "base"
-                 geojson_path = output_dir / "pan_adminlines.geojson"
-            else:
-                 # Default behavior
-                 geojson_path = output_dir / f"{dataset_name}.geojson"
-            # Ensure directory exists (critical for Docker build)
-            output_dir.mkdir(parents=True, exist_ok=True)
-            with open(geojson_path, 'wb') as f:
-                f.write(response.content)
-            gdf = gpd.read_file(geojson_path)
-            logger.info(f"Loaded {len(gdf)} features")
-            return geojson_path, len(gdf)
-    except Exception as e:
-        logger.error(f"Failed to download {dataset_name}: {e}")
-        return None, 0
-def main():
-    logger.info("=== Downloading HDX Panama Datasets ===")
-    results = []
-    for name, info in HDX_DATASETS.items():
-        path, count = download_and_extract_hdx(name, info["url"], info["description"])
-        if path:
-            results.append({"dataset": name, "count": count, "path": path})
-    logger.info("\n=== Download Summary ===")
-    for result in results:
-        logger.info(f"  {result['dataset']}: {result['count']} features")
-    return results
-if __name__ == "__main__":
-    main()