Vivienda, el origen de muchos problemas

Hace no demasiado tiempo traduje un artículo que resume muy bien por qué la vivienda es la madre de muchos problemas.

En general, cuando discuto sobre este tema, me suelo centrar mucho en la renta disponible, el ahorro y la inversión, ya que es un tema central en la economía y generalmente es fácil de argumentar.

En el tiempo que llevo leyendo sobre el tema, he encontrado que es difícil contar con datos precisos. Por ejemplo, no he encontrado un mejor proxy para medir la demanda de vivienda que usar el padrón de habitantes, y para la oferta se complica aún más, porque hay datos de visados de obra y de stock, pero no de la oferta en sí misma.

Naturalmente esto te conduce a pensar que es buena idea scrapear los resultados de Idealista y Fotocasa, pero eso presenta sus propios problemas.

También está el tema del alquiler. Aunque obtuvieses un pipeline perfectamente curado del scrapeo anterior, con datos fiables de la oferta de alquiler ¿qué puedes usar de proxy para la demanda? Hasta donde he sido capaz de averiguar, las CCAA no publican, o publican muy poco, sobre sus depósitos de fianzas, y las distribuciones de renta que hay en el INE se hacen vía encuestas, y la muestra no es lo suficientemente grande para desagregar por provincias, no digamos ya ciudades.

Existe la Muestra Contínua de Vidas Laborales, pero hay que rellenar un formulario, te la envía por DVD (sí, estás leyendo bien) y ponen muchas pegas para explotar los datos.

Lo que realmente quiero hacer es un dashboard donde cruzar oferta y demanda para todas las capitales de provincia + otras ciudades importantes. Primero porque es un tema que me parece importante, donde tengo unas hipótesis que quiero contrastar, y segundo porque estoy aprendiendo a programar y es un proyecto que seguro que me da un buen rodaje.

Pero el origen de los datos ya es un problema.

No sé si alguno de vosotros puede arrojar algo de luz sobre este problema.