V
Valkoru
Equipo Valkoru Abril 2026 9 min
Metodología · Datos Financieros
Metodología · Datos Financieros

El censo sabe dónde vive la deuda, pero no cuánto pesa. Así lo estimamos.

Proyectamos la EFH 2024 del Banco Central a 216.341 manzanas censales usando imputación por perfil macrozona × segmento de ingreso. 12 celdas. 8 variables financieras. 0% de manzanas sin asignar.

Autor Equipo Valkoru
Publicado Abril 2026
Lectura 9 minutos
216.341 Manzanas cubiertas
12 Celdas EFH efectivas
8 Variables financieras
0% Manzanas sin asignar

Tres fuentes de datos, tres mundos distintos

Para entender un territorio en Chile, hoy existen tres fuentes de referencia. Cada una mide algo distinto, y ninguna habla el idioma de las otras.

El Censo 2024 tiene cobertura total y resolución máxima —manzana a manzana— pero no pregunta cuánto gana ni cuánto gasta la gente. La CASEN 2024 mide ingresos y pobreza, representativa a nivel comunal. Y la EFH 2024 (Encuesta Financiera de Hogares del Banco Central) mide algo que ninguna de las otras dos toca: conducta financiera real. Cuánto gastan en el supermercado. Si tienen deuda hipotecaria. Si usan cuenta bancaria. Cuánto pesan las cuotas sobre sus ingresos.

El problema: la EFH es la única fuente pública con datos de gasto, deuda y activos financieros por hogar en Chile — pero su cobertura geográfica es de apenas 4 macrozonas × 3 segmentos de ingreso. No tiene datos comunales. No tiene datos por barrio. Tiene 12 celdas para todo el país.

La pregunta que motiva este trabajo es directa: ¿podemos asignar esas 12 celdas EFH a cada una de las 216.341 manzanas del censo, de forma que la asignación sea metodológicamente honesta y útil para caracterizar el perfil financiero del territorio?

Imputación por perfil, no proyección espacial

Antes de describir el método, es importante ser explícito sobre lo que no es.

Proyección espacial (CASEN)
Datos comunales observados
Calibración intra-comunal con proxy censal
Variación entre manzanas de la misma comuna
Error macro < 0.3% vs CASEN real
Validable con leave-one-commune-out
Imputación por perfil (EFH)
Solo 12 celdas en todo Chile
Sin variación intra-celda posible
Manzanas del mismo perfil → valores idénticos
No validable a nivel de manzana
Útil para caracterizar perfil, no valor exacto

La EFH no permite hacer lo que hicimos con la CASEN. No hay suficiente resolución geográfica para calibrar dentro de cada zona. Lo que sí permite es responder: "¿qué tipo de hogar, financieramente hablando, vive en esta manzana?" — usando el perfil de macrozona y segmento de ingreso como caracterizador.

Metodología

En simple: cada manzana se clasifica en una de 12 celdas según dónde está (macrozona) y cuánto gana (segmento de ingreso CASEN). Luego recibe los valores medios de esa celda. Sin más. Sin variación intra-celda. Sin espacialización.
1
Calcular estadísticas por celda desde EFH
Con los 4.649 hogares observados (imp=0) de la EFH 2024, se calculan estadísticas ponderadas por el factor de expansión para cada combinación macrozona × segmento de ingreso. Resultado: una tabla de 12 filas con los valores representativos de cada perfil financiero.
2
Clasificar cada manzana en su celda
Macrozona ← derivada de COD_REGION del Censo 2024 (Región 13 → RM, Región 5 → Centro, etc.).
Segmento de ingreso ← derivado del ingreso per cápita proyectado por CASEN: Segmento 1 si < $323.002, Segmento 2 si $323k–$690k, Segmento 3 si > $690.000.
3
Asignar valores de celda a cada manzana
Lookup directo. Todas las manzanas en la misma celda reciben exactamente los mismos valores EFH. Esto es una propiedad explícita del método. Se verifica en los tests.

Decisiones de agregación

La EFH combina montos, proporciones y preguntas binarias. Por eso no se aplica una única fórmula a todo: algunos indicadores se resumen como promedios ponderados, otros como proporciones de hogares y otros como ratios agregados por celda. La regla pública es simple: cada indicador se calcula con la agregación que mejor preserva su significado económico.

Dimensiones que agrega esta capa

En lugar de exponer un diccionario técnico de variables, Valkoru traduce la EFH en dimensiones de lectura territorial útiles para negocio:

Gasto alimentario
Aproxima la presión mensual de consumo básico y permite distinguir territorios donde alimentación pesa más en el presupuesto familiar.
Dependencia del automóvil
Distingue perfiles donde la movilidad está más asociada al uso de auto frente a transporte público.
Penetración de deuda
Identifica territorios donde el uso de crédito está más extendido entre los hogares.
Carga financiera efectiva
Estima qué tan exigente es la deuda para los hogares que efectivamente están endeudados.
Bancarización
Mide acceso al sistema financiero formal y capacidad de operar con productos bancarios o digitales.
Patrimonio financiero
Aproxima presencia de ahorro, inversión y activos financieros en el perfil territorial.

Los datos

Fuente Unidad Cobertura Variables relevantes
EFH 2024 Banco Central Hogar 4.649 hogares observados · 4 macrozonas · 3 segmentos de ingreso Gasto por categoría, deuda, activos, uso de medios de pago
CASEN 2024 (proyectada) Manzana 216.341 manzanas projected_income_pc para asignar segmento de ingreso
Censo 2024 INE Manzana 216.341 manzanas COD_REGION para asignar macrozona

La EFH usa múltiple imputación (30 versiones imputadas + la base observada). Para esta proyección se usa exclusivamente imp=0 — los datos originales sin imputar. Esto maximiza la transparencia: los valores provienen directamente de los hogares encuestados, sin ajustes estadísticos adicionales. Es una decisión conservadora — promediar las 30 versiones imputadas también sería estadísticamente válido, pero introduce una capa de modelación adicional que preferimos evitar en esta primera versión.

Resultados por celda — Región Metropolitana

La RM opera con macrozona 4. Las tres celdas reflejan el gradiente socioeconómico que cualquier persona que conozca Santiago reconocería:

Segmento Manzanas Gasto alimentos Ratio auto % con deuda Carga deuda (cond.) % bancarizados % con activos fin. Activos fin. (cond.)
D1–D5 23.772 $200.468 0.47 32.5% 76.5% 13.6% 8.5% $2.611.880
D6–D8 35.118 $283.959 0.68 56.8% 40.2% 30.9% 22.6% $5.349.945
D9–D10 7.983 $467.636 0.77 75.9% 39.9% 74.7% 39.8% $39.314.795
Tres patrones que vale la pena leer:
1. La carga de deuda condicional es más alta en D1–D5 (76.5%) que en D9–D10 (39.9%). Los hogares con menos ingresos que logran endeudarse destinan una fracción mucho mayor a pagar cuotas.
2. La bancarización salta de 14% a 75% entre el segmento bajo y el alto — tres de cuatro hogares de altos ingresos tienen cuenta, contra uno de siete en los más vulnerables.
3. La deuda es más común en los segmentos altos (76% vs 33%), pero el peso relativo es menor.

Fallbacks y transparencia

Dos situaciones pueden requerir un fallback durante la asignación de celdas:

  • Región sin mapeo EFH: fallback a macrozona 2 (Centro). Se registra internamente y se reporta con el número exacto de manzanas afectadas.
  • Ingreso CASEN nulo: en lugar de asignar directamente al segmento 1 (como hacía la versión inicial), se intenta primero la mediana comunal de CASEN; si tampoco existe, se usa la mediana nacional ($323.002). También se marca como fallback.
Para la RM: 0 manzanas con fallback. La CASEN 2024 cubre las 52 comunas de la Región Metropolitana con muestras de ≥30 observaciones en todas ellas. El fallback existe para el caso nacional, donde algunas comunas muy pequeñas no tienen representación CASEN.

Limitaciones reconocidas

Nota de alcance: esta capa no mide deuda, gasto ni activos financieros observados por manzana. Imputa perfiles agregados desde celdas macrozona × segmento de ingreso. Es útil para caracterizar perfiles territoriales, no para afirmar valores exactos de hogares o manzanas individuales.
  • Resolución real: 12 celdas, no 216.341 manzanas. Todas las manzanas del mismo perfil reciben valores idénticos. La EFH no permite más granularidad. Esto no es un defecto del pipeline — es una propiedad del método que se declara explícitamente.
  • Sin validación de ground truth. No existe ningún dataset público con gasto financiero real por manzana en Chile. Los tests validan estructura, rangos y ordenamiento lógico entre celdas, no precisión absoluta por manzana.
  • La media condicional de activos puede ser volátil. Con solo 8–12% de hogares con activos financieros en los segmentos bajos, la media condicional puede verse influenciada por pocos hogares con activos muy altos. Por eso debe interpretarse junto con la proporción de hogares que efectivamente tienen activos financieros.
  • La EFH no captura economía informal. Los gastos e ingresos informales están subreportados. Las celdas de menores ingresos pueden subestimar tanto gasto real como activos.
  • Los cutpoints de segmento son nacionales. $323.002 (D5) y $690.000 (D8) son medianas nacionales de CASEN. En regiones con estructura de ingresos distinta al promedio nacional, la asignación de segmento puede no capturar bien la posición relativa local.

Qué agrega esta capa a Valkoru

El Censo 2024 y la CASEN proyectada ya describen bien la estructura demográfica y los ingresos de cada manzana. Lo que la EFH agrega es una dimensión que ninguna de las otras dos cubre directamente:

Gasto Cuánto y en qué gastan
Deuda Penetración e intensidad
Banco Acceso a sistema financiero
Activos Patrimonio financiero

En términos del simulador: antes, un agente sintético de La Pintana sabía que tenía ingresos bajos, escolaridad media-baja y hacinamiento. Ahora también sabe que hogares de ese perfil financiero muestran tasas de endeudamiento significativas, cargas relevantes entre quienes tienen deuda, y baja penetración bancaria. Eso cambia cómo reacciona a una oferta de crédito, a un producto de ahorro, o a una política de inclusión financiera.

Esta capa es especialmente útil para industrias que hoy tienen que adivinar la capacidad de pago territorial: banca, fintech, seguros, retail e inmobiliario.

Apéndice técnico

  • Fuente: EFH 2024, Banco Central de Chile (Base imputada EFH 2024.dta)
  • Registros utilizados: imp=0 (4.649 hogares observados de los 144.119 totales incluyendo las 30 imputaciones)
  • Cutpoints de segmento: D5 = $323.002 · D8 = $690.000 (CASEN 2024, nacionales)
  • Macrozona RM: Región 13 → macrozona 4. Norte: regiones 1/2/3/4/15. Centro: 5/6/7/16. Sur: 8/9/10/11/12/14.
  • Cobertura RM: 66.873 manzanas · 0 fallbacks · 12/12 celdas con ≥30 observaciones
  • Tests automatizados: 25 pruebas (estructura, rangos, consistencia de celda, ordenamiento lógico, metadatos)
Haz tu primera consulta territorial.

Explora perfiles financieros, consumo, seguridad y oportunidades territoriales desde una misma interfaz.