El censo sabe dónde vive la deuda, pero no cuánto pesa. Así lo estimamos.
Proyectamos la EFH 2024 del Banco Central a 216.341 manzanas censales usando imputación por perfil macrozona × segmento de ingreso. 12 celdas. 8 variables financieras. 0% de manzanas sin asignar.
Tres fuentes de datos, tres mundos distintos
Para entender un territorio en Chile, hoy existen tres fuentes de referencia. Cada una mide algo distinto, y ninguna habla el idioma de las otras.
El Censo 2024 tiene cobertura total y resolución máxima —manzana a manzana— pero no pregunta cuánto gana ni cuánto gasta la gente. La CASEN 2024 mide ingresos y pobreza, representativa a nivel comunal. Y la EFH 2024 (Encuesta Financiera de Hogares del Banco Central) mide algo que ninguna de las otras dos toca: conducta financiera real. Cuánto gastan en el supermercado. Si tienen deuda hipotecaria. Si usan cuenta bancaria. Cuánto pesan las cuotas sobre sus ingresos.
La pregunta que motiva este trabajo es directa: ¿podemos asignar esas 12 celdas EFH a cada una de las 216.341 manzanas del censo, de forma que la asignación sea metodológicamente honesta y útil para caracterizar el perfil financiero del territorio?
Imputación por perfil, no proyección espacial
Antes de describir el método, es importante ser explícito sobre lo que no es.
La EFH no permite hacer lo que hicimos con la CASEN. No hay suficiente resolución geográfica para calibrar dentro de cada zona. Lo que sí permite es responder: "¿qué tipo de hogar, financieramente hablando, vive en esta manzana?" — usando el perfil de macrozona y segmento de ingreso como caracterizador.
Metodología
Segmento de ingreso ← derivado del ingreso per cápita proyectado por CASEN: Segmento 1 si < $323.002, Segmento 2 si $323k–$690k, Segmento 3 si > $690.000.
Decisiones de agregación
La EFH combina montos, proporciones y preguntas binarias. Por eso no se aplica una única fórmula a todo: algunos indicadores se resumen como promedios ponderados, otros como proporciones de hogares y otros como ratios agregados por celda. La regla pública es simple: cada indicador se calcula con la agregación que mejor preserva su significado económico.
Dimensiones que agrega esta capa
En lugar de exponer un diccionario técnico de variables, Valkoru traduce la EFH en dimensiones de lectura territorial útiles para negocio:
Los datos
| Fuente | Unidad | Cobertura | Variables relevantes |
|---|---|---|---|
| EFH 2024 Banco Central | Hogar | 4.649 hogares observados · 4 macrozonas · 3 segmentos de ingreso | Gasto por categoría, deuda, activos, uso de medios de pago |
| CASEN 2024 (proyectada) | Manzana | 216.341 manzanas | projected_income_pc para asignar segmento de ingreso |
| Censo 2024 INE | Manzana | 216.341 manzanas | COD_REGION para asignar macrozona |
La EFH usa múltiple imputación (30 versiones imputadas + la base observada).
Para esta proyección se usa exclusivamente imp=0 — los datos
originales sin imputar. Esto maximiza la transparencia: los valores provienen
directamente de los hogares encuestados, sin ajustes estadísticos adicionales.
Es una decisión conservadora — promediar las 30 versiones imputadas también
sería estadísticamente válido, pero introduce una capa de modelación adicional
que preferimos evitar en esta primera versión.
Resultados por celda — Región Metropolitana
La RM opera con macrozona 4. Las tres celdas reflejan el gradiente socioeconómico que cualquier persona que conozca Santiago reconocería:
| Segmento | Manzanas | Gasto alimentos | Ratio auto | % con deuda | Carga deuda (cond.) | % bancarizados | % con activos fin. | Activos fin. (cond.) |
|---|---|---|---|---|---|---|---|---|
| D1–D5 | 23.772 | $200.468 | 0.47 | 32.5% | 76.5% | 13.6% | 8.5% | $2.611.880 |
| D6–D8 | 35.118 | $283.959 | 0.68 | 56.8% | 40.2% | 30.9% | 22.6% | $5.349.945 |
| D9–D10 | 7.983 | $467.636 | 0.77 | 75.9% | 39.9% | 74.7% | 39.8% | $39.314.795 |
1. La carga de deuda condicional es más alta en D1–D5 (76.5%) que en D9–D10 (39.9%). Los hogares con menos ingresos que logran endeudarse destinan una fracción mucho mayor a pagar cuotas.
2. La bancarización salta de 14% a 75% entre el segmento bajo y el alto — tres de cuatro hogares de altos ingresos tienen cuenta, contra uno de siete en los más vulnerables.
3. La deuda es más común en los segmentos altos (76% vs 33%), pero el peso relativo es menor.
Fallbacks y transparencia
Dos situaciones pueden requerir un fallback durante la asignación de celdas:
- Región sin mapeo EFH: fallback a macrozona 2 (Centro). Se registra internamente y se reporta con el número exacto de manzanas afectadas.
- Ingreso CASEN nulo: en lugar de asignar directamente al segmento 1 (como hacía la versión inicial), se intenta primero la mediana comunal de CASEN; si tampoco existe, se usa la mediana nacional ($323.002). También se marca como fallback.
Limitaciones reconocidas
- Resolución real: 12 celdas, no 216.341 manzanas. Todas las manzanas del mismo perfil reciben valores idénticos. La EFH no permite más granularidad. Esto no es un defecto del pipeline — es una propiedad del método que se declara explícitamente.
- Sin validación de ground truth. No existe ningún dataset público con gasto financiero real por manzana en Chile. Los tests validan estructura, rangos y ordenamiento lógico entre celdas, no precisión absoluta por manzana.
- La media condicional de activos puede ser volátil. Con solo 8–12% de hogares con activos financieros en los segmentos bajos, la media condicional puede verse influenciada por pocos hogares con activos muy altos. Por eso debe interpretarse junto con la proporción de hogares que efectivamente tienen activos financieros.
- La EFH no captura economía informal. Los gastos e ingresos informales están subreportados. Las celdas de menores ingresos pueden subestimar tanto gasto real como activos.
- Los cutpoints de segmento son nacionales. $323.002 (D5) y $690.000 (D8) son medianas nacionales de CASEN. En regiones con estructura de ingresos distinta al promedio nacional, la asignación de segmento puede no capturar bien la posición relativa local.
Qué agrega esta capa a Valkoru
El Censo 2024 y la CASEN proyectada ya describen bien la estructura demográfica y los ingresos de cada manzana. Lo que la EFH agrega es una dimensión que ninguna de las otras dos cubre directamente:
En términos del simulador: antes, un agente sintético de La Pintana sabía que tenía ingresos bajos, escolaridad media-baja y hacinamiento. Ahora también sabe que hogares de ese perfil financiero muestran tasas de endeudamiento significativas, cargas relevantes entre quienes tienen deuda, y baja penetración bancaria. Eso cambia cómo reacciona a una oferta de crédito, a un producto de ahorro, o a una política de inclusión financiera.
Esta capa es especialmente útil para industrias que hoy tienen que adivinar la capacidad de pago territorial: banca, fintech, seguros, retail e inmobiliario.
Apéndice técnico
- Fuente: EFH 2024, Banco Central de Chile (
Base imputada EFH 2024.dta) - Registros utilizados: imp=0 (4.649 hogares observados de los 144.119 totales incluyendo las 30 imputaciones)
- Cutpoints de segmento: D5 = $323.002 · D8 = $690.000 (CASEN 2024, nacionales)
- Macrozona RM: Región 13 → macrozona 4. Norte: regiones 1/2/3/4/15. Centro: 5/6/7/16. Sur: 8/9/10/11/12/14.
- Cobertura RM: 66.873 manzanas · 0 fallbacks · 12/12 celdas con ≥30 observaciones
- Tests automatizados: 25 pruebas (estructura, rangos, consistencia de celda, ordenamiento lógico, metadatos)
Explora perfiles financieros, consumo, seguridad y oportunidades territoriales desde una misma interfaz.