5 minutos

La tecnología está impactando en el mundo de la medicina y viene de la mano de datos sobre el estado de la salud de las personas que pueden ser tomados de la vida cotidiana y hasta enviados en tiempo real para ser integrados con otros millones de datos.

Cuando se habla de big data en salud, se apela a datos observacionales en vez de experimentales. Los datos no fueron generados por ningún experimento planificado explícitamente, sino que surgen de observar las acciones de las personas.
Cada vez se están usando más registros médicos electrónicos para almacenar información de salud. Radiografías, resonancias, resultados de laboratorio, signos vitales, tratamientos, forman parte de los registros médicos electrónicos. Estos datos están disponibles en distintos formatos que hay que anonimizar, organizar y agregar para responder preguntas a nivel poblacional. A su vez, a partir de esa información, se tratará de hacer inferencias y predicciones sobre poblaciones mayores.
A través de un trabajo meticuloso se puede ir de una cantidad masiva de datos anárquicos y aparentemente inconexos (censos, encuestas, información en línea) a un subconjunto pequeño, pero que puede ser estudiado como si hubiese provenido de un experimento. Por ejemplo, se pueden extraer datos de redes sociales y de distintos dispositivos que usan las personas para obtener información de aplicación en salud pública.
En un trabajo publicado por Barrett y colaboradores en 2013 plantearon que, datos de salud provenientes del uso de sensores y aplicaciones en el celular pueden integrarse a los registros médicos electrónicos, evitando el error inherente a la carga de datos y permitiendo visualizar los datos en tiempo real. Así, big data puede jugar un rol importante tanto en actividades de investigación como de intervención y acelerar el progreso en la prevención de enfermedades y la salud pública. Por ejemplo, a través de la identificación automatizada de factores de riesgo de enfermedades.
En nuestro país, se hizo un trabajo interesante para detectar potenciales áreas de alta prevalencia de Chagas en regiones no consideradas endémicas; es decir, áreas que probablemente estén habitadas por una población potencialmente afectada por la enfermedad de Chagas. Para ello, se trabajó con unos 10.500.000.000 registros de llamados telefónicos que estaban anonimizados y se buscaron relaciones frecuentes de llamados entre zonas endémicas con personas que viven en otras áreas. Para definir áreas endémicas, se consideraron variables obtenidas del Censo nacional de población, hogares y viviendas 2010. Por ejemplo, se identificaron zonas con condiciones para albergar la vinchuca basándose en el tipo de material de los pisos, material del exterior del techo y la existencia o no de cielo raso. Al mismo tiempo, se consideró el nivel socioeconómico y la cercanía a centros de salud. Estas grandes bases de datos y su georreferenciamiento necesitan de una alta capacidad de procesamiento (big data) para poder ser analizadas. Así, el trabajo de Vázquez Brust y col. logra construir un mapa de prevalencia potencial de Chagas con la intención de guiar acciones e intervenciones del estado a diferentes niveles.
Actualmente, en medio de la pandemia del coronavirus SARS-CoV-2 y ante el flujo incesante de información, vale más que nunca la cuarta V del big data, la veracidad. Se debe partir de datos confiables como los de la Organización Mundial de la Salud (OMS) para intentar realizar cualquier análisis. Afortunadamente, así lo están haciendo diversos grupos de investigación, publicando datos prácticamente en tiempo real.
En Our world in data – Coronavirus Disease (COVID-19) – Statistics and Research (https://ourworldindata.org/coronavirus), se publica información agregada de forma tal de reunir los datos relevantes y facilitar la comprensión de los datos publicados y la investigación temprana sobre el brote de coronavirus. El equipo de Our world in data reporta y ofrece visualizaciones basadas en los datos de la OMS y del European Centre for Disease Prevention and Control (ECDC)”, que son actualizados diariamente.

CONCLUSIONES
•    La tecnología está impactando en el mundo de la medicina y viene de la mano de datos sobre el estado de la salud de las personas que pueden ser tomados de la vida cotidiana y hasta enviados en tiempo real para ser integrados con otros millones de datos.
•    Simplemente recolectar datos no es suficiente, no debe perderse la capacidad de generar preguntas que necesitan ser respondidas y de discutir ideas.
•    Los datos deben “curarse”: extracción, organización, transformación, sistematización y luego deben ser analizados con procesamiento estadístico.
•    Big data no sirve para explicar fenómenos complejos que poseen una dificultad intrínseca que hace que, a pesar de la masividad de los datos, la predicción de esos fenómenos continúe siendo difícil.

Bibliografía
Sosa Escudero, W. Big data. Siglo XXI editores, Argentina, 2019
Data Growth, Business Opportunities, and the IT Imperatives, 2014. Recuperado de: https://www.emc.com/leadership/digital-universe/2014iview/executive-summ…
Stigler, S.M. Los siete pilares de la sabiduría estadística. Editorial Grano de Sal, México, 2018
Barrett, M.A.; Humblet, O.; Hiatt, R.A. y Adler, N.E. Big data and disease prevention: from quantified self to quantified communities. Big data, Vol. 1 (3), 2013
Vazquez Brust, A.; Olego, T.; Rosati, G.; Lang, C.; Bozzoli, G.; Weinberg, D.; Chuit, R.; Minnoni, M.A. y Sarraute, C. Detecting areas of potential high prevalence of Chagas in Argentina. En Companion Proceedings de la 2019 World Wide Web Conference, 13-17 de mayo de 2019, San Francisco, CA, USA. ACM, New York, NY, USA, 2019 https://www.mundosano.org/wp-content/uploads/2020/03/Detecting-Areas-of-…

Marina Travacio, docente de la Cátedra de Química General e Inorgánica, Facultad de Farmacia y Bioquímica, UBA.