Spaces:

de-Rodrigo
/

Embeddings

Sleeping

App Files Files Community

de-Rodrigo commited on Sep 11, 2025

Commit

7affc5d

1 Parent(s): 003c3e3

Try Visualizing Llava Embeddings

Browse files

Files changed (2) hide show

app.py +43 -1
data/{llava_de_Rodrigo_merit_secret_all_embeddings.csv → llava/vanilla/averaged/de_Rodrigo_merit_secret_all_embeddings.csv} +0 -0

app.py CHANGED Viewed

@@ -191,6 +191,45 @@ def load_embeddings(model, version, embedding_prefix, weight_factor):
                 "synthetic": pd.concat([df_seq, df_line, df_par, df_rot, df_zoom, df_render], ignore_index=True),
                 "pretrained": df_pretratrained}
     else:
         st.error("Modelo no reconocido")
@@ -1667,7 +1706,7 @@ def run_model(model_name):
 def main():
     config_style()
-    tabs = st.tabs(["Donut", "Idefics2" , "Paligemma"])
     with tabs[0]:
         st.markdown('<h2 class="sub-title">Donut 🤗</h2>', unsafe_allow_html=True)
         run_model("Donut")
@@ -1677,6 +1716,9 @@ def main():
     with tabs[2]:
         st.markdown('<h2 class="sub-title">Paligemma 🤗</h2>', unsafe_allow_html=True)
         run_model("Paligemma")
 if __name__ == "__main__":
     model_options = [

                 "synthetic": pd.concat([df_seq, df_line, df_par, df_rot, df_zoom, df_render], ignore_index=True),
                 "pretrained": df_pretratrained}
+    elif model == "Llava":
+        df_real = pd.read_csv(f"data/llava/{version}/{embedding_prefix}/de_Rodrigo_merit_secret_all_{weight_factor}embeddings.csv")
+        #TODO Embeddings de Paligemma se mantienen para evitar error
+        df_par = pd.read_csv(f"data/paligemma/{version}/{embedding_prefix}/de_Rodrigo_merit_es-digital-paragraph-degradation-seq_{weight_factor}embeddings.csv")
+        df_line = pd.read_csv(f"data/paligemma/{version}/{embedding_prefix}/de_Rodrigo_merit_es-digital-line-degradation-seq_{weight_factor}embeddings.csv")
+        df_seq  = pd.read_csv(f"data/paligemma/{version}/{embedding_prefix}/de_Rodrigo_merit_es-digital-seq_{weight_factor}embeddings.csv")
+        df_rot  = pd.read_csv(f"data/paligemma/{version}/{embedding_prefix}/de_Rodrigo_merit_es-digital-rotation-degradation-seq_{weight_factor}embeddings.csv")
+        df_zoom = pd.read_csv(f"data/paligemma/{version}/{embedding_prefix}/de_Rodrigo_merit_es-digital-zoom-degradation-seq_{weight_factor}embeddings.csv")
+        df_render = pd.read_csv(f"data/paligemma/{version}/{embedding_prefix}/de_Rodrigo_merit_es-render-seq_{weight_factor}embeddings.csv")
+        # Cargar ambos subconjuntos pretrained y combinarlos
+        # TODO Pretrained de idefics2, se mantienen para evitar error, pero se debe meter los de paligemma
+        df_pretratrained_PDFA = pd.read_csv(f"data/idefics2/{version}/{embedding_prefix}/de_Rodrigo_merit_aux_PDFA_{weight_factor}embeddings.csv")
+        df_pretratrained_IDL = pd.read_csv(f"data/idefics2/{version}/{embedding_prefix}/de_Rodrigo_merit_aux_IDL_{weight_factor}embeddings.csv")
+        df_pretratrained = pd.concat([df_pretratrained_PDFA, df_pretratrained_IDL], ignore_index=True)
+        # Asignar etiquetas de versión
+        df_real["version"] = "real"
+        df_par["version"] = "synthetic"
+        df_line["version"] = "synthetic"
+        df_seq["version"] = "synthetic"
+        df_rot["version"] = "synthetic"
+        df_zoom["version"] = "synthetic"
+        df_render["version"] = "synthetic"
+        df_pretratrained["version"] = "pretrained"
+        # Asignar fuente (source)
+        df_par["source"] = "es-digital-paragraph-degradation-seq"
+        df_line["source"] = "es-digital-line-degradation-seq"
+        df_seq["source"] = "es-digital-seq"
+        df_rot["source"] = "es-digital-rotation-degradation-seq"
+        df_zoom["source"] = "es-digital-zoom-degradation-seq"
+        df_render["source"] = "es-render-seq"
+        df_pretratrained["source"] = "pretrained"
+        return {"real": df_real,
+                "synthetic": pd.concat([df_seq, df_line, df_par, df_rot, df_zoom, df_render], ignore_index=True),
+                "pretrained": df_pretratrained}
     else:
         st.error("Modelo no reconocido")
 def main():
     config_style()
+    tabs = st.tabs(["Donut", "Idefics2" , "Paligemma", "Llava"])
     with tabs[0]:
         st.markdown('<h2 class="sub-title">Donut 🤗</h2>', unsafe_allow_html=True)
         run_model("Donut")
     with tabs[2]:
         st.markdown('<h2 class="sub-title">Paligemma 🤗</h2>', unsafe_allow_html=True)
         run_model("Paligemma")
+    with tabs[3]:
+        st.markdown('<h2 class="sub-title">Llava 🤗</h2>', unsafe_allow_html=True)
+        run_model("Llava")
 if __name__ == "__main__":
     model_options = [

data/{llava_de_Rodrigo_merit_secret_all_embeddings.csv → llava/vanilla/averaged/de_Rodrigo_merit_secret_all_embeddings.csv} RENAMED Viewed

File without changes