En qué gasta cada manzana: proyectamos la EPF 2022 al territorio.
Proyectamos la IX EPF del INE a 216.341 manzanas censales. 12 celdas macrozona × segmento de ingreso. 8 variables de estructura de consumo. La Ley de Engel en cada barrio de Chile.
El mapa de ingresos no es el mapa del consumo
Sabemos dónde vive la gente. Sabemos, con la proyección CASEN, cuánto gana cada manzana. Y sabemos, con la proyección EFH, cómo es su relación con el sistema financiero. Lo que no sabíamos — hasta ahora — es en qué gastan.
Un hogar de ingresos medios en el norte de Chile y uno en Santiago pueden tener ingresos similares pero estructuras de consumo radicalmente distintas. En el norte, una fracción mayor se va en alimentos (el costo de vida es más alto fuera de la RM). En Santiago, el gasto en transporte sube con el ingreso a medida que el auto desplaza al transporte público. Esa diferencia no aparece en los datos de ingresos.
La pregunta que motiva este trabajo es: ¿podemos asignar esas 12 celdas a cada manzana del censo de forma metodológicamente honesta, de modo que el perfil de consumo del territorio quede disponible para el simulador?
Imputación por perfil, no proyección espacial
Al igual que hicimos con la EFH, la EPF no tiene resolución comunal. No es posible calibrar el gasto intra-comunal con proxies censales porque no hay datos comunales de los que partir. El método es diferente al usado con CASEN:
La EPF responde la pregunta: "¿qué tipo de hogar, por sus hábitos de consumo, vive en esta manzana?" — no cuánto gasta exactamente esa manzana específica. Es una propiedad explícita del método, no un defecto oculto.
Metodología
fe) para cada combinación
macrozona × CSE (clase socioeconómica). Resultado: una tabla de 12 filas
con el gasto per cápita y la distribución de ese gasto por división CCIF.
Segmento de ingreso ← derivado del ingreso per cápita proyectado por CASEN: Segmento 1 si < $323.002, Segmento 2 si $323k–$690k, Segmento 3 si > $690.000.
Cómo se construye la estructura de gasto
Para cada celda, el peso de cada categoría de gasto se calcula de forma agregada y ponderada. Esto evita que hogares con gasto total muy bajo distorsionen categorías pequeñas y permite representar mejor la estructura promedio de consumo del perfil.
En simple: la capa no intenta adivinar cuánto gastó una manzana puntual. Asigna a cada perfil territorial una estructura de consumo consistente con la encuesta y la usa como señal comparativa para análisis de mercado.
Dimensiones que agrega esta capa
La EPF se transforma en dimensiones de consumo que ayudan a entender cómo cambia la presión presupuestaria según el territorio:
Los datos fuente
| Fuente | Unidad | Cobertura | Variable clave usada |
|---|---|---|---|
| IX EPF 2022 (INE) | Hogar | 15.134 hogares · 4 macrozonas · 3 CSE | gastot_d01_hd … gastot_d13_hd, fe |
| CASEN 2024 (proyectada) | Manzana | 216.341 manzanas | projected_income_pc para asignar segmento |
| Censo 2024 INE | Manzana | 216.341 manzanas | COD_REGION para asignar macrozona |
Resultados por celda — Región Metropolitana
La RM opera con macrozona 4. Las tres celdas muestran un gradiente de consumo reconocible: a mayor ingreso, la alimentación cede participación en el presupuesto mientras que el transporte y la educación ganan peso.
| Segmento | Manzanas | Gasto/cápita | Alimentos | Vivienda | Transporte | Salud | Educación | Recreación | Restaurantes |
|---|---|---|---|---|---|---|---|---|---|
| D1–D5 | 23.772 | $301.809 | 23.2% | 21.3% | 16.4% | 6.0% | 1.4% | 4.1% | 2.6% |
| D6–D8 | 35.118 | $445.692 | 19.7% | 19.2% | 16.6% | 8.7% | 2.7% | 4.0% | 3.8% |
| D9–D10 | 7.983 | $799.718 | 13.4% | 17.0% | 20.3% | 8.6% | 4.9% | 4.2% | 5.0% |
La Ley de Engel en Santiago
Ernst Engel observó en 1857 que la proporción del presupuesto destinada a alimentos cae al subir el ingreso. Los datos de la RM lo confirman 167 años después:
1. El share de alimentos cae de 23.2% a 13.4% entre el segmento bajo y el alto en RM — una diferencia de casi 10 puntos porcentuales sobre un presupuesto 2.6× mayor.
2. El transporte sube de 16.4% a 20.3% con el ingreso. En la RM, los hogares de mayores ingresos gastan más en proporción en movilidad — el auto desplaza al metro.
3. Educación crece 3.5× en share: de 1.4% a 4.9%. En términos absolutos, la brecha es aún mayor: $4.233 mensuales por cápita en D1–D5 vs $39.187 en D9–D10.
Variación macrorregional
La estructura de consumo también varía entre macrozonas, no solo entre segmentos de ingreso. En el norte del país, los hogares de ingreso bajo destinan 34.8% al gasto alimentario — 12 puntos más que en la RM para el mismo segmento — reflejando el diferencial de precios fuera de la Región Metropolitana. En el sur, el share de transporte es alto en todos los segmentos, consistente con distancias mayores y menor densidad del transporte público.
| Macrozona | Segmento | Gasto/cápita | Alimentos | Transporte | Vivienda | Educación |
|---|---|---|---|---|---|---|
| Norte (1) | D1–D5 | $310.346 | 34.8% | 12.7% | 13.8% | 1.8% |
| Norte (1) | D9–D10 | $760.031 | 19.0% | 15.8% | 15.8% | 4.8% |
| Sur (3) | D1–D5 | $303.666 | 30.6% | 15.4% | 13.4% | 1.5% |
| Sur (3) | D9–D10 | $763.766 | 17.2% | 17.8% | 15.3% | 5.0% |
| RM (4) | D1–D5 | $301.809 | 23.2% | 16.4% | 21.3% | 1.4% |
| RM (4) | D9–D10 | $799.718 | 13.4% | 20.3% | 17.0% | 4.9% |
Fallbacks y transparencia
El proceso de asignación registra explícitamente cualquier situación que requiera usar un valor de respaldo:
- Región sin mapeo EPF: fallback a macrozona 2 (Centro). Aplica a regiones no contempladas en el diseño muestral de la EPF.
- Ingreso CASEN nulo: se intenta primero la mediana comunal proyectada; si tampoco existe, se usa la mediana nacional ($323.002).
Limitaciones reconocidas
- Resolución real: 12 celdas, no 216.341 manzanas. Todas las manzanas del mismo perfil reciben valores idénticos. La EPF no permite más granularidad. Esta es una propiedad explícita del método.
- Sin validación de ground truth. No existe ningún dataset público con estructura de gasto por manzana en Chile. Los tests validan estructura, rangos, consistencia intra-celda y la Ley de Engel — no precisión absoluta. La unidad efectiva de inferencia sigue siendo la celda macrozona × segmento, no la manzana individual.
- EPF 2022, no 2024. La encuesta data de 2022. La estructura de gasto puede haber cambiado con la inflación de 2022–2023 y los cambios en precios relativos (especialmente energía y alimentos). Las shares son más estables que los valores absolutos.
- La EPF no captura economía informal. El gasto en mercados informales y servicios no declarados está subreportado. Los segmentos de menor ingreso pueden subestimar su gasto real en categorías como alimentos y ropa.
- Los cutpoints de segmento son los de CASEN 2024. La asignación de una manzana al segmento 1/2/3 depende de la proyección CASEN. Los errores de proyección CASEN se propagan a la asignación de celda EPF.
Qué agrega esta capa a Valkoru
Con las tres proyecciones completas, cada manzana tiene ahora tres dimensiones independientes de su perfil:
En términos del simulador: un agente sintético de una manzana de ingresos medios en el sur de Chile ahora incorpora que hogares de ese perfil destinan cerca del 25% de su gasto a alimentos, que el transporte pesa más en su presupuesto que en la RM, y que el gasto discrecional en educación y recreación es modesto. Eso cambia cómo el agente reacciona a una propuesta de servicio de delivery, a un aumento en el precio del combustible, o a un programa de vouchers educativos.
Esta capa es especialmente útil para industrias que diseñan productos con sensibilidad territorial al precio y al gasto: retail, alimentación, transporte y movilidad, salud, educación y cualquier sector que compita por la misma billetera del hogar.
Apéndice técnico
- Fuente: IX Encuesta de Presupuestos Familiares 2022, INE Chile (
base-personas-ix-epf-(formato-csv).csv) - Hogares: 15.134 únicos (44.688 personas); deduplicados a un registro por hogar para el análisis de gasto
- Clasificador: CCIF (Clasificación del Consumo Individual por Finalidad), 13 divisiones de D01 a D13
- Cutpoints de segmento: D5 = $323.002 · D8 = $690.000 (CASEN 2024, nacionales; mismos que EFH)
- Macrozona RM: Región 13 → macrozona 4. Norte: 1/2/3/4/15. Centro: 5/6/7/16. Sur: 8/9/10/11/12/14.
- Cobertura país: 216.341 manzanas · 0 fallbacks · 12/12 celdas con ≥30 observaciones
- Tests automatizados: 20 pruebas (estructura, rangos, consistencia de celda, Ley de Engel, suma de shares, metadatos)
Explora patrones de consumo, ingreso, seguridad y oportunidades territoriales desde una misma interfaz.