*Por Julieta Daniele
“Our World in Data”, sitio estadístico vinculado a la Universidad de Oxford, tomó la determinación de quitar a la Argentina de uno de sus listados a nivel mundial de datos sobre el coronavirus porque aseguró que varias de las cifras oficiales difundidas no tienen la calidad suficiente como para mostrar correctamente la situación.
De esta manera, El Doce le consultó directamente a uno de los miembros de la organización para que dé detalles sobre por qué se tomó tal medida. A continuación, las respuestas de Esteban Ortiz-Ospina.
¿Por qué decidieron excluir los datos de Argentina?
Eliminamos los datos de tests en Argentina de nuestro conjunto de datos porque nos dimos cuenta que muchas pruebas con resultado negativo no se estaban registrando en varias provincias, incluidas algunas grandes como Córdoba. Este problema ha sido confirmado en un comunicado de prensa del Ministerio de Salud, y ha sido documentado también en varios diarios.
+ MIRÁ MÁS: No exigirán más hisopado ni cuarentena para ingresar a Córdoba
La decisión de eliminar los datos de tests de nuestro conjunto de datos se tomó siguiendo los criterios metodológicos de nuestro equipo técnico, los cuales son públicos y están disponibles en la sección de preguntas frecuentes de nuestra página web.
El subregistro de resultados negativos en los tests implica que la tasa positiva (la proporción de pruebas que arrojan un resultado positivo) está sobreestimada. Al momento de tomar la decisión de excluir los datos de Argentina de nuestro conjunto de datos, la tasa positiva según los datos oficiales era del 76%. Es imposible saber exactamente en qué medida esta cifra está sesgada al alza, hasta que no sepamos en qué medida se estaban restringiendo los resultados negativos. Sin embargo, en cualquier caso, está claro que la tasa positiva en Argentina es extremadamente alta para los estándares internacionales, lo que indica que no se están realizando suficientes pruebas para monitorear adecuadamente el brote.
Es clave recalcar que este problema no afecta los datos sobre casos confirmados o muertes, que siguen estando incluidos en nuestros datos de COVID-19.
¿Qué datos excluyeron exactamente? ¿Se trata solo de pruebas?
Se excluyeron los datos sobre el número de tests y personas testeadas en Argentina. También se excluyeron otras métricas que se derivan de estos datos, como la tasa positiva y la proporción de pruebas por caso.
Continuamos reportando datos sobre casos confirmados y muertes.
¿Han excluido alguna vez datos de otro país?
Tenemos criterios claros para la inclusión de datos en nuestra base de datos. No todos los datos de tests publicados por los países cumplen con nuestros criterios, y por lo tanto, no todos los países figuran en nuestro conjunto de datos.
En ocasiones ha sucedido también que los datos oficiales no cumplen con los criterios sólo durante un período de tiempo – una vez que los datos se publican nuevamente de acuerdo con nuestros criterios, los incluimos en nuestro conjunto de datos de nuevo.
Nos complace ver que las autoridades argentinas están al tanto del subregistro de pruebas negativas y están comprometidas a abordar el problema. Tan pronto como este problema se haya corregido claramente, comenzaremos a incluir datos de prueba para Argentina en nuestro conjunto de datos nuevamente.
¿Por qué es importante informar los resultados positivos y negativos de las pruebas?
Si solo se registran adecuadamente los resultados positivos, pero no los negativos, esto hace que el nivel total de pruebas parezca más bajo de lo que realmente es, y hace que la tasa positiva (la proporción de pruebas que arrojan un resultado positivo) parezca más alta.
La tasa positiva es una métrica vital para comprender si el nivel de las pruebas es suficiente para monitorear adecuadamente el brote. Según los criterios publicados por la OMS en mayo, una tasa positiva de menos del 5% es un indicador de que la epidemia está bajo control en un país.
¿Cómo se dieron cuenta de que Argentina no informaba el número de pruebas?
Sospechamos que algo podría estar mal con los datos porque la tasa de positivos era extremadamente alta. Aunque se han observado tasas positivas muy altas en otros países, nunca habíamos observado una tasa positiva tan alta como la calculada recientemente para Argentina. Poco tiempo después, nos dimos cuenta de los reportes que informaban sobre problemas en la carga de resultados en algunas provincias.
¿Cómo detectaron que había un "sesgo"?
Cuando usamos la palabra "sesgo", lo decimos en un sentido estadístico: introducir un sesgo significa utilizar un método de recopilación o recuento de datos que produce un resultado que no refleja con precisión la situación real. Aunque se han observado tasas positivas muy altas en otros países, nunca habíamos observado una tasa positiva tan alta como la calculada recientemente para Argentina. Esto nos hizo sospechar que algo se estaba calculando incorrectamente en los datos de prueba de Argentina.
Si nuestro país hubiera reportado correctamente los datos, ¿hay alguna manera de saber dónde estaríamos en el ranking?
No podemos dar una estimación de cuál es la tasa positiva real de Argentina sin saber cuántas pruebas negativas no se han registrado. Sin embargo, está claro que la tasa real de positivos en Argentina es en cualquier caso extremadamente alta para los estándares internacionales, y esto indica que no se están realizando suficientes pruebas para monitorear adecuadamente el brote de casos.
¿Solo tienen este problema con Argentina, o también es un problema que tienen otros países? ¿Podría mencionar algunos ejemplos?
Actualmente solo somos conscientes de este problema específico, en el cual las pruebas negativas no se registran en su totalidad, en el caso de Argentina.
Sin embargo, existen problemas de calidad de datos en otros países. Por ejemplo, varios países de América Latina incluyen resultados positivos de anticuerpos en sus cifras de casos confirmados. Nuestros datos de pruebas no incluyen pruebas de anticuerpos (positivas o negativas), de acuerdo con nuestros criterios. Para estos países, incluimos cifras de pruebas (solo PCR) en nuestro conjunto de datos, pero no derivamos nuestras dos métricas que comparan los casos confirmados con el nivel de las pruebas (la tasa positiva y la proporción de pruebas por caso), ya que los dos conjuntos de datos no son comparables.
Este es el caso actualmente de Brasil, Colombia, Costa Rica, Ecuador y Perú.
¿Cuál creen que es la causa de este problema de datos? ¿Es el resultado de negligencia o de una estrategia deliberada para manipular los datos?
La recopilación, gestión y notificación de datos ha sido un desafío constante para muchos países a lo largo de la pandemia. En este sentido, el problema observado en los datos de tests en Argentina no es un ejemplo aislado.
También vale la pena señalar que, en este caso, el problema con los datos hace que la situación en Argentina parezca peor de lo que es en realidad: subestimando el volumen de pruebas que se están realizando y exagerando la tasa positiva.
Más allá de esto, no podemos especular sobre las causas de este problema con los datos de prueba.