La Mentira de la Dimensionalidad: Tus Embeddings de 768D Son En Realidad ~20D
Analizamos más de 30 datasets de embeddings. PC1 captura 88-99% de varianza en cada uno. Tus vectores de alta dimensionalidad esconden una verdad de baja dimensionalidad—y te está costando 40x en almacenamiento.