Spaces:

VicGerardoPR
/

CSVExcelReader

Sleeping

App Files Files Community

VicGerardoPR commited on Sep 26, 2025

Commit

ed951c2

verified ·

1 Parent(s): 1fd409f

Update app.py

Browse files

Files changed (1) hide show

app.py +238 -113

app.py CHANGED Viewed

@@ -1,115 +1,240 @@
-import streamlit as st
-import pandas as pd
-import matplotlib.pyplot as plt
-import seaborn as sns
 import io
-import base64
-# Configuración básica de la página
-st.set_page_config(page_title="Contador Simple", page_icon="📊")
-# Título de la aplicación
-st.title("📊 Visualizador de Conteos")
-st.markdown("### Carga tus archivos CSV y genera gráficos de conteo")
-# Función para cargar archivos múltiples
-def load_data():
-    uploaded_files = st.file_uploader("Carga uno o más archivos CSV", type=["csv"], accept_multiple_files=True)
-    if not uploaded_files:
-        return None
-    all_data = {}
-    for uploaded_file in uploaded_files:
-        try:
-            # Cargar el archivo
-            df = pd.read_csv(uploaded_file)
-            # Guardar en el diccionario con el nombre del archivo como clave
-            all_data[uploaded_file.name] = df
-            st.success(f"✅ Archivo '{uploaded_file.name}' cargado correctamente")
-        except Exception as e:
-            st.error(f"❌ Error al cargar '{uploaded_file.name}': {e}")
-    return all_data
-# Función para crear gráfico de conteo
-def create_count_plot(data, column):
-    fig, ax = plt.subplots(figsize=(10, 6))
-    # Contar valores
-    value_counts = data[column].value_counts().sort_values(ascending=False)
-    # Si hay demasiados valores únicos, mostrar solo los primeros 15
-    if len(value_counts) > 15:
-        value_counts = value_counts.head(15)
-        plt.title(f"Top 15 valores más frecuentes - {column}")
     else:
-        plt.title(f"Conteo de valores - {column}")
-    # Crear DataFrame para seaborn
-    count_df = value_counts.reset_index()
-    count_df.columns = [column, 'conteo']
-    # Crear gráfico
-    bars = sns.barplot(x=column, y='conteo', data=count_df, ax=ax)
-    # Añadir etiquetas con el número exacto
-    for i, p in enumerate(bars.patches):
-        bars.annotate(f'{int(p.get_height())}',
-                     (p.get_x() + p.get_width() / 2., p.get_height()),
-                     ha='center', va='bottom')
-    # Ajustar eje X para mejor visualización
-    plt.xticks(rotation=45, ha='right')
-    plt.tight_layout()
-    return fig
-# Función para descargar imagen
-def get_download_link(fig, filename):
-    buf = io.BytesIO()
-    fig.savefig(buf, format='png', dpi=300, bbox_inches='tight')
-    buf.seek(0)
-    b64 = base64.b64encode(buf.read()).decode()
-    href = f'<a href="data:image/png;base64,{b64}" download="{filename}.png">📥 Descargar imagen</a>'
-    return href
-# Función principal
-def main():
-    # Cargar datos
-    all_data = load_data()
-    if all_data:
-        # Seleccionar archivo
-        selected_file = st.selectbox("Selecciona un archivo", list(all_data.keys()))
-        # Obtener el DataFrame seleccionado
-        data = all_data[selected_file]
-        # Mostrar información básica
-        st.subheader(f"Vista previa: {selected_file}")
-        st.dataframe(data.head())
-        # Mostrar información de filas y columnas
-        st.info(f"Filas: {data.shape[0]} | Columnas: {data.shape[1]}")
-        # Seleccionar columna para visualizar
-        column = st.selectbox("Selecciona una columna para contar", data.columns)
-        # Botón para generar gráfico
-        if st.button("Generar Gráfico de Conteo"):
-            # Verificar que la columna existe y tiene datos
-            if column in data.columns and not data[column].empty:
-                # Crear y mostrar el gráfico
-                fig = create_count_plot(data, column)
-                st.pyplot(fig)
-                # Botón para descargar imagen
-                st.markdown(get_download_link(fig, f"conteo_{selected_file}_{column}"), unsafe_allow_html=True)
-            else:
-                st.error(f"La columna '{column}' no existe o está vacía.")
-# Ejecutar la aplicación
-if __name__ == "__main__":
-    main()

+import os
 import io
+import unicodedata
+import pandas as pd
+import streamlit as st
+import plotly.express as px
+# -----------------------------
+# Configuración de la página
+# -----------------------------
+st.set_page_config(
+    page_title="Employee Count Dashboard",
+    page_icon="📊",
+    layout="wide",
+)
+# -----------------------------
+# Utilidades
+# -----------------------------
+def normalize(s: str) -> str:
+    """Normaliza un nombre de columna: minúsculas, sin acentos, sin dobles espacios."""
+    s = unicodedata.normalize("NFKD", s).encode("ascii", "ignore").decode("utf-8", "ignore")
+    return " ".join(s.lower().split())
+def find_target_column(df: pd.DataFrame, target="extskhis_emp full name") -> str | None:
+    """Encuentra la columna objetivo, siendo tolerante a acentos/espacios/caso."""
+    norm_map = {col: normalize(col) for col in df.columns}
+    for col, norm in norm_map.items():
+        if norm == normalize(target):
+            return col
+    # fallback: columnas muy parecidas
+    candidates = [c for c, n in norm_map.items() if "full" in n and "name" in n]
+    return candidates[0] if candidates else None
+@st.cache_data(show_spinner=False)
+def load_csv(file_obj) -> pd.DataFrame:
+    return pd.read_csv(file_obj)
+@st.cache_data(show_spinner=False)
+def load_sample(sample_path: str) -> pd.DataFrame | None:
+    if os.path.exists(sample_path):
+        return pd.read_csv(sample_path)
+    return None
+def pretty_number(n: int) -> str:
+    return f"{n:,}".replace(",", " ")
+# -----------------------------
+# Estilos (UI) – look limpio
+# -----------------------------
+CUSTOM_CSS = """
+<style>
+/* Fondo suave y tarjetas con glass effect */
+.stApp { background: linear-gradient(180deg, #f8fafc 0%, #eef2f7 100%); }
+.block-container { padding-top: 1.5rem; }
+/* Tarjetas KPI */
+.kpi-card {
+  border-radius: 14px;
+  padding: 18px 20px;
+  background: rgba(255, 255, 255, 0.75);
+  backdrop-filter: blur(6px);
+  border: 1px solid rgba(0,0,0,0.06);
+  box-shadow: 0 10px 20px -12px rgba(0,0,0,0.12);
+}
+.kpi-label { font-size: 0.85rem; color: #5b6573; margin-bottom: 6px; }
+.kpi-value { font-size: 1.6rem; font-weight: 700; color: #111827; }
+/* Contenedor principal */
+.section-card {
+  border-radius: 16px;
+  padding: 20px;
+  background: #ffffff;
+  border: 1px solid #e5e7eb;
+  box-shadow: 0 12px 24px -16px rgba(0,0,0,0.18);
+}
+/* Título con acento */
+h1 span.accent {
+  background: linear-gradient(90deg, #2563eb, #06b6d4);
+  -webkit-background-clip: text;
+  -webkit-text-fill-color: transparent;
+}
+</style>
+"""
+st.markdown(CUSTOM_CSS, unsafe_allow_html=True)
+# -----------------------------
+# Sidebar (carga de datos)
+# -----------------------------
+st.sidebar.title("⚙️ Configuración")
+uploaded = st.sidebar.file_uploader("Sube tu archivo CSV", type=["csv"])
+sample_note = st.sidebar.empty()
+# Carga de datos: CSV subido o fallback sample
+df = None
+source_label = ""
+if uploaded is not None:
+    try:
+        # Usa bytes para mantener cache estable
+        data_bytes = uploaded.getvalue()
+        df = load_csv(io.BytesIO(data_bytes))
+        source_label = f"Fuente: Archivo subido — **{uploaded.name}**"
+    except Exception as e:
+        st.sidebar.error(f"Error al leer el CSV: {e}")
+else:
+    # intenta cargar sample
+    df_sample = load_sample("data/sample.csv")
+    if df_sample is not None:
+        df = df_sample
+        source_label = "Fuente: `data/sample.csv` (muestra)"
+        sample_note.info("No subiste archivo. Mostrando un ejemplo desde `data/sample.csv`.")
     else:
+        sample_note.warning("No subiste archivo y no existe `data/sample.csv`. Sube un CSV para continuar.")
+# -----------------------------
+# UI principal
+# -----------------------------
+st.title("📊 Employee Count Dashboard · <span class='accent'>EXTSKHIS_EMP FULL NAME</span>", anchor=False)
+if df is None or df.empty:
+    st.info("Sube un CSV con la columna **EXTSKHIS_EMP FULL NAME** para ver el dashboard.")
+    st.stop()
+target_col = find_target_column(df, "EXTSKHIS_EMP FULL NAME")
+if target_col is None:
+    st.error("No se encontró la columna **EXTSKHIS_EMP FULL NAME** (o equivalente). Verifica los encabezados.")
+    st.write("Columnas detectadas:", list(df.columns))
+    st.stop()
+# Limpieza básica del campo (opcional)
+df[target_col] = df[target_col].astype(str).str.strip()
+# -----------------------------
+# Controles
+# -----------------------------
+with st.sidebar:
+    st.divider()
+    st.subheader("Filtros")
+    search = st.text_input("Filtrar por nombre (contiene)", placeholder="Ej: Maria, Juan...")
+    min_count = st.number_input("Mínimo de ocurrencias", min_value=1, value=1, step=1)
+    top_n = st.slider("Mostrar Top N", min_value=5, max_value=100, value=20, step=5)
+    sort_mode = st.radio("Orden", ["Por conteo (desc)", "Alfabético (A→Z)"], index=0)
+# Aplica filtro de texto
+df_filtered = df
+if search:
+    s = search.lower()
+    df_filtered = df[df[target_col].str.lower().str.contains(s, na=False)]
+# Agrega conteos
+counts = (
+    df_filtered.groupby(target_col, dropna=False)
+    .size()
+    .reset_index(name="Count")
+)
+# Filtra por mínimo de ocurrencias
+counts = counts[counts["Count"] >= min_count]
+# Ordena
+if sort_mode == "Por conteo (desc)":
+    counts = counts.sort_values("Count", ascending=False)
+else:
+    counts = counts.sort_values(target_col, ascending=True)
+# Top N
+counts_top = counts.head(top_n)
+# -----------------------------
+# KPIs
+# -----------------------------
+c1, c2, c3 = st.columns(3)
+with c1:
+    st.markdown("<div class='kpi-card'>"
+                "<div class='kpi-label'>Registros totales</div>"
+                f"<div class='kpi-value'>{pretty_number(len(df))}</div>"
+                "</div>", unsafe_allow_html=True)
+with c2:
+    st.markdown("<div class='kpi-card'>"
+                "<div class='kpi-label'>Nombres únicos</div>"
+                f"<div class='kpi-value'>{pretty_number(counts[target_col].nunique())}</div>"
+                "</div>", unsafe_allow_html=True)
+with c3:
+    st.markdown("<div class='kpi-card'>"
+                "<div class='kpi-label'>Mostrando en gráfico</div>"
+                f"<div class='kpi-value'>{pretty_number(len(counts_top))}</div>"
+                "</div>", unsafe_allow_html=True)
+# Fuente de datos
+st.caption(source_label)
+# -----------------------------
+# Gráfico
+# -----------------------------
+st.markdown("### 🔎 Conteo por **EXTSKHIS_EMP FULL NAME**")
+if counts_top.empty:
+    st.warning("No hay filas que cumplan los filtros actuales.")
+else:
+    # Para mejorar legibilidad en barras, hacemos categoría ordenada
+    category_order = counts_top.sort_values(
+        "Count", ascending=False
+    )[target_col].tolist()
+    fig = px.bar(
+        counts_top,
+        x="Count",
+        y=target_col,
+        orientation="h",
+        text="Count",
+        category_orders={target_col: category_order},
+        height=600 if len(counts_top) <= 25 else 800,
+    )
+    fig.update_traces(textposition="outside", cliponaxis=False)
+    fig.update_layout(
+        xaxis_title="Conteo",
+        yaxis_title="Nombre",
+        margin=dict(l=10, r=10, t=30, b=10),
+        bargap=0.25,
+    )
+    st.plotly_chart(fig, use_container_width=True, theme="streamlit")
+# -----------------------------
+# Tabla de detalle
+# -----------------------------
+with st.expander("📄 Ver tabla de conteos"):
+    st.dataframe(counts.reset_index(drop=True), use_container_width=True)
+# -----------------------------
+# Descargar resultados
+# -----------------------------
+csv_bytes = counts.to_csv(index=False).encode("utf-8")
+st.download_button(
+    "⬇️ Descargar conteos (CSV)",
+    data=csv_bytes,
+    file_name="employee_counts.csv",
+    mime="text/csv",
+)