HISTORIAS
Manolo contra los lobbies
Manolo es una sencilla herramienta de búsqueda que contiene los registros de visitantes de varias instituciones gubernamentales en Perú. Uno puede digitar un nombre y saber si una persona ha visitado 14 instituciones públicas en cuestión de segundos.
El problema que se ha encontrado Manolo según Carlos Peña, en su artículo How Web Scraping is Revealing Lobbying, es que las instituciones peruanas no proporcionan los datos de los visitantes de una manera estructurada (con una interfaz API). No es sencillo recuperar estos datos en un formato legible por algún tipo de máquina, por lo que la única manera de conseguir la información es mediante el raspado (screen scraping) de sus sitios web y luego haciendo lo que se podría llamar minería de datos.
Como señala Peña, la Ley peruana de Transparencia obliga a las instituciones gubernamentales a mantener un sitio web donde publican la lista de las personas que visitan sus oficinas. Cada visitante debe registrar su número de documento de identidad, la razón por la que hacen la visita, y el servidor público al que están visitando junto con la hora de entrada, hora de salida y fecha de visita.
El buscador está compuesto por una serie de scripts que a diario descargan la información de la página web del control de visitas del organismo que se quiere analizar. Luego, los datos descargados se indexan y se almacenan en una base de datos local (SQLite).
El objetivo de sus creadores es transparentar los niveles de presión que ejercen los lobistas profesionales o los grupos de poder económico, sobre los funcionarios públicos. La idea es que los periodistas usen la herramienta para realizar labor de seguimiento de los grupos de presión alrededor de los temas que son de interés.
Manolo ha sido desarrollado por varios voluntarios que contribuyen durante sus horas libres, y ahora ha incluido la lista de deudores de alimentos (REDAM), entre otra información que es útil como punto de partida de investigaciones pero que debe ser contrastada con las fuentes originales si se quiere usar para otro propósito.
Lo interesante de la herramienta es que sus creadores incluso ponen a disposición el código fuente del buscador para que cualquier programador pueda usarlo para desarrollar otros buscadores similares y contribuir con sus desarrollos a luchar contra la corrupción en nuestro país.
Todo un esfuerzo que destacar de los desarrolladores de Manolo. Enhorabuena.
Publicar un comentario