Quería saber como @Belmonte (y compañía (si hay)) rastrea el BOE.
¿Miras uno por uno los títulos o filtras por algún método?
¿Cómo encuentras las perlas que enlazas aquí ?
Muchas gracias por este seguimiento que haces
Quería saber como @Belmonte (y compañía (si hay)) rastrea el BOE.
¿Miras uno por uno los títulos o filtras por algún método?
¿Cómo encuentras las perlas que enlazas aquí ?
Muchas gracias por este seguimiento que haces
Hola, Lluís. Esta es una muy buena pregunta. Podríamos hacer una sesión para socios sobre El BOE nuestro de cada día. Te confirmo que es nuestra compañera @Belmonte la que se encarga en exclusiva de leer el BOE todos los días para encontrar esas perlazas.
Lo decía porque se me ha ocurrido hacer algo más automatizado para mirar qué se publica cada día en el BOE y no sé si será de su interés. O bien porque ya hay estas herramientas o porque no serían útiles en su día a día. En cualquier caso lo intentaré hacer este fin de semana y ya diré algo.
Hola, Lluís.
¡Mil gracias por tus palabras! Aunque sí pido ayuda para temas más amplios, la lectura diaria sí es tarea en solitario, sí. Le hemos dado muchas vueltas por aquí sobre cómo automatizar parte de lo que hago cada mañana y todo lo que hemos visto automatizable se ha hecho. Pero, por desgracia, no es mucho. El problema es que la mayoría de temas surgen por el contexto, el conocimiento de las normas, las relaciones con otros temas… algo muy difícil de explicar a una máquina, sobre todo teniendo en cuenta la infinidad de temas que trata el BOE. Incluso si pensamos que hay partes que normalmente no son relevantes, como la convocatoria de unas oposiciones, pueden serlo tras una época de congelación de nuevas plazas, por ejemplo, o si se convocan en plena campaña electoral, y para eso es necesario conocer el contexto y es muy difícil enseñar a una máquina a entender todas esas variables.
Sí usamos tecnología para tener activas determinadas alertas en temas relevantes o para extraer información de los textos legales en bloque y escribir artículos como el de las cartas de naturaleza o, nuestro mejor ejemplo de extracción de información del BOE, El Indultómetro, además de muchos otros.
Le hemos dado muchas vueltas, la verdad, porque todo lo que pueda simplificar mis mañanas ayuda mucho Pero cualquier idea es bien recibida. ¡Gracias!
Claro, buscar relatos es bastante difícil para una máquina.
Parece que parte del problema que tienes en filtrar los datos es reciente y que antes se publicaban menos cosas en el BOE, fue a partir de finales de 2017 que empezaron a haber más publicaciones… habiendo más disposiciones que anuncios por aquellas fechas:
(Cómo curiosidad: solo se ha publicado el BOE dos veces en domingo en los últimos 10 años)
He hecho un pequeño programa programa para descargar y preparar los sumarios del BOE para saber que dice cada publicación. Espero que os sirva para que te sea más fácil seleccionar cual es el contenido relevante del día.
¡Qué interesante el gráfico! Mil gracias. Estamos echándole un ojo al programa, vaya curro te has pegado el fin de semana
He corregido algunos errores del programa.
Seguro que ya tenéis bastante trabajo pero he creado una página web para ver algunos resúmenes del BOE, hay algunas tendencias curiosas. Ya me diréis si necesitáis algún cambio más.
Hola, Lluís.
Yo, como informático, he pensado a veces con Eva cómo automatizar al menos parte de lo que hace, y nunca hemos encontrado una buena forma. Lo que sí he hecho es montarle un pequeño sistema de alertas para algún tema muy concreto (como los indultos) y extraigo información de todo el BOE cuando ella identifica un tema interesante de largo recorrido: sanciones a funcionarios, algún tipo de subvención, etc. Para esto último uso Ruby/Python con expresiones regulares.
Yo no me he dado por vencido con lo de automatizar partes de su trabajo, y quiero probar en algún momento algún sistema de banderas rojas sobre cosas como la contratación pública (estamos en un proyecto europeo sobre esto). Y estoy aprendiendo cosas de Procesamiento de Lenguaje Natural por si podemos aplicar algo aquí. Mi objetivo no es llegar a un procesamiento totalmente automático, que ahora no me parece viable, si no algo semi-automático que destaque una lista de anuncios potencialmente relevante para Eva (que seguiría leyendo el resto en cualquier caso).
Con R hemos trabajado poco hasta ahora, solo en un tema de Medicamentalia de hace un tiempo, pero gracias por crear la librería, porque soy consciente de que R es muy potente para el tipo de análisis global que has hecho, y me gustaría que lo usáramos más.
Hola David,
Sí, me he dado cuenta mirando los repositorios de Civio en Github. Se puede usar R desde python con rpy2. Lo digo por si quiereis automatizar descargar el sumario de cada dia y mostrar los resultados en una bonita tabla. Al menos es así como pensé el programa.
Yo tampoco veo que sea muy automatizable (el periodismo no lo es) pero quería hacer más fácil poder seleccionar lo que de verdad hay que leer a fondo o patrones relevantes (y aprender a trabajar con xml).
En cualquier caso si queréis mirar algo a lo largo del BOE o en algún caso más detallado contad conmigo.
Muchas gracias, Lluís. Sobre el BOE no sé, pero alguna pregunta de R yo creo que sí te caerá.
Yo si necesitáis ayuda con el sistema que haga todo eso, podéis contar con mi ayuda.
Encantado de ayudar (sobre el BOE sois más expertos pero me refería a usar el programa si es que lo usáis )
¡Por mi genial! Había empezado una web con los resultados, pero si quieres automatizarlo ¡adelante!