El mundo digital nos permite navegar entre grandes cantidades de información que, a través del periodismo de datos, logran ser comprensibles, útiles y accesibles para los ciudadanos. ¿Cuál es la metodología detrás de un trabajo de esta índole?, ¿Qué preguntas hacer antes de iniciar un proyecto periodístico con bases de datos? Milagros Salazar Herrera, directora de Convoca.pe, respondió a estas preguntas durante la charla ‘Big data y herramientas digitales para el periodismo de investigación’, actividad organizada por la Escuela de Investigación Periodística y de Datos de Convoca.pe.

Milagros Salazar Herrera investiga desde hace 15 años el impacto de las industrias extractivas en el Perú y como parte de ese proceso se encontró con grandes cantidades de información que no sólo requerían un orden, sino un análisis e interpretación.

Cuando fundó Convoca y asumió como directora, Milagros desplegó un trabajo investigativo para conocer cómo operan las compañías mineras y petroleras a nivel nacional y fue así que construyó y analizó junto a su equipo una gran base de datos sobre el nivel de incumplimiento de las normas ambientales de estas actividades económicas predominantes en el Perú.

El resultado de este trabajo que destapó la situación de la fiscalización ambiental y las infracciones de varias empresas, se reflejó en Excesos sin castigo’, el proyecto ganador del Data Journalism Awards en 2016, el reconocimiento más importante para el periodismo de datos a escala global.

Cinco años después del primer reportaje, centenares de investigaciones y hallazgos, Convoca lanzó Deep Data, la plataforma más completa sobre industrias extractivas en el Perú, que explora, analiza y procesa 2.4 millones de datos sobre infracciones de normas ambientales, laborales, accidentes de trabajo, derrames de petróleo, pasivos ambientales y otras informaciones. 

Los hallazgos de estas investigaciones fueron posibles gracias a la construcción, procesamiento y análisis de las bases de datos, a partir de una mirada periodística. Milagros nos contó sobre su experiencia y compartió ocho ideas claves que ayudan a definir el inicio de una investigación con bases de datos. 

1. ¿A qué nivel de profundidad quiero llegar en este océano de datos?

Responder esta primera pregunta permitirá al investigador conocer la ambición de su proyecto y hasta dónde quiere llegar. Lo recomendable es empezar con casos concretos.

2. ¿Existe información estructurada y confiable en bases de datos sobre el tema que vas a investigar?

Una de las primeras conclusiones a la que llegó la periodista cuando decidió investigar las industrias extractivas es que el Estado tenía amplia información al respecto debido a la importancia de estas actividades en la economía peruana. Sin embargo, mucha información estaba dispersa y desestructurada, es decir, no era fácil encontrar toda la información en un solo lugar y de manera completa.

3. ¿Cuál es el grado de dificultad para acceder, procesar, limpiar y analizar estas bases de datos?

Hay que observar el formato en el que se tiene la información. No siempre está estructurada en hojas de cálculo o accesible, a veces están en formato PDF, son fotografías o viejos documentos escaneados. Llevar esta información a una base de datos, puede demandar tiempo y costo, por lo que hay que evaluar el grado de dificultad. 

4. ¿Qué nivel de conocimiento tengo sobre el tema?

El ciclo virtuoso de los datos requiere comprensión, contexto y conocimiento suficiente para entender los datos. Es necesario nutrirse sobre el tema de investigación para comprender los resultados y sobre todo no olvidarse que la principal arma que tiene un periodista es cuestionar, no dar por sentado nada. 

5. ¿Qué herramientas y programas informáticos podemos usar?

Existen diversos programas, pero hasta el momento el más práctico y útil si se quiere comenzar es Excel. En ocasiones los periodistas trabajan con ‘R’ , un lenguaje de programación enfocado en el análisis estadístico. 

6. ¿Con qué perfiles necesito contar en mi equipo?

Para el desarrollo de Convoca Deep Data se procesaron más de 2.4 millones de datos y fue importante el trabajo entre periodistas de datos, desarrolladores, científicos de datos, arquitectos de la información. Sin embargo, para comenzar es suficiente un periodista con gran interés en desarrollar una mentalidad de datos y dispuesto a confrontar la información en forma constante.

7. ¿Cuál es el proceso de trabajo? 

Tiene que establecerse un proceso de trabajo con los datos, de lo contrario se volverá caótico. Si existen diversos miembros en el equipo, es clave reconocer el rol y el aporte de cada participante  Un coordinar o editor para ver quién hace qué en cada etapa ayuda a darle fluidez al proyecto.

8. ¿Cuál es la metodología que usaremos?

No existe un proyecto basado en datos sin metodología porque de ella depende la rigurosidad del trabajo. Es importante definir el método y publicarlo, debemos ser transparentes con la forma en que llegamos a cada conclusión.


Si quieres ver la charla registrada en vivo, en la que participaron los periodistas Milagros Salazar y Luis Enrique Pérez de Convoca.pe, puedes acceder aquí al vídeo:

 

Taller de la Escuela Convoca ‘Investigar con big data temas de impacto público’

Milagros Salazar Herrera, dictará el taller 'Investigar con big data temas de impacto público' los días 30 y 31 de octubre para la Escuela Convoca. El taller es parte del programa de especialización en periodismo de datos: 'Laboratorio de Datos'.

Los estudiantes aprenderán el ciclo de trabajo con bases de datos para cazar historias de interés público y generar conocimiento al servicio de los ciudadanos. Analizarán casos concretos de investigaciones periodísticas, aprenderán a construir una metodología de trabajo, fortalecerán su capacidad de análisis y procesamiento de información de manera eficiente y conocerán los puntos clave para construir un proyecto con bases de datos. 

Regístrate aquí para asegurar tu vacante.

 ¿Qué otros espacios de aprendizaje incluye el 'Laboratorio de Datos'?

1. Curso online y sesión en vivo: Herramientas digitales para el periodismo de datos.
2. Taller: Aplicaciones web y visualización de datos.

El programa Laboratorio de Datos busca promover que más profesionales y estudiantes investiguen con bases de datos para revelar de manera sólida patrones, tendencias y conexiones en diversos temas de relevancia pública. Quienes se matriculen a los dos talleres y el curso participarán en una sesión especial de mentoría con Milagros Salazar Herrera.

Síguenos a través de nuestras redes sociales y se parte de la Comunidad Convoca.

Web: https://escuela.convoca.pe/

Twitter: https://twitter.com/EscuelaConvoca

Facebook: https://www.facebook.com/EscuelaConvoca