El Quijote de los números: La peligrosa política de las cifras Covid-19

El Quijote de los números: La peligrosa política de las cifras Covid-19

01 Octubre 2020

Hablar con el español Antonio Fernández Anta es adentrarse en el mundo de las cifras que circulan alrededor del virus SARS-COV-2 más conocido como Covid-19.

Pía Díaz >
authenticated user Corresponsal Corresponsal Ciudadano

Pía Díaz, corresponsal El Martutino, Madrid.

Hay una parábola india en la que cinco sabios ciegos deben describir el animal que tienen delante de acuerdo a lo que pueden tocar y ninguno logra describir el elefante, porque es muy distinta la descripción del que puede tocar la trompa del animal al que le toca la cola. 

Y con la pandemia existe el riesgo de algo similar porque cada organización, cada país y cada partido político tiene un sesgo que le impide reconocer todos los datos. 

Hablar con el español Antonio Fernández Anta es adentrarse en el mundo de las cifras que circulan alrededor del virus SARS-COV-2 más conocido como Covid-19. Este científico, de 54 años, tienes varios premios nacionales a sus espaldas, como el Premio Nacional de Informática “Aritmel” en 2019 y es Mercator Fellow del SFB MAKI en Alemania desde 2018. Tiene más de 25 años de experiencia en investigación y más de 200 publicaciones científicas. Este ex Profesor Universitario, con estancias postdoctoral en el MIT y sabáticos en los laboratorios Bell Labs en Murray Hill y MIT Media Lab y actual Research Professor en el IMDEA Networks Insitute, cree que los números pueden ayudar y mucho a la humanidad. Él dedica todos sus recursos en esta lucha casi quijotesca por lograr recabar de manera rápida y lo más cercana a la realidad apelando a la generosidad de la gente, datos sobre el Covid. Todo depende de que las personas respondan su encuesta Coronasurveys y que lo hagan semanalmente. 

¿Por que es importante tener estas predicciones? 

Es importante para saber si está subiendo o está bajando el nivel de contagio. Con este confinamiento parcial, para saber si está teniendo efecto o no lo antes posible. Sin datos no hay idea de lo que está pasando. Saber cuánta gente hay infectada hoy nos permite actuar para tener las camas, los respiradores que serán necesarios. Nos permite ir adelantándonos para controlar el virus. 

Uno de los primeros países en aceptar el desafío de participar Coronasurveys.org fue Chile. ¿Cómo eligió un país tan lejano? 

Tuve un alumno chileno de doctorado y lo llamé y así Chile fue uno de los primeros países latinoamericanos en entrar en esta encuesta. Además, he participado en varios proyectos con la Universidad de Chile. 

¿Cómo surge la idea de hacer esta encuesta? 

El 13 de marzo, luego de seguir la pandemia pero no como epidemiólogo sino informático, constaté que en España no habían suficientes recursos para saber cuántos casos reales se estaban produciendo. En España se hacían unos 10.000 PCR diarios y era claro que se necesitaban más. Desesperado me puse a pensar cómo se podría estimar mejor los casos y el 13 lancé una encuesta de “juguete” en Twitter preguntando cuánta gente tenían en su entorno a personas infectadas. Tuve 700 respuesta y aplicando el número Dunbar, utilizado en sociología, tomé la cifra de la portada de El País, que decía que había unos 3.000 casos confirmados. Ahora según la respuesta en Twitter a mí pregunta la estimación mía era que había más de 150 mil casos. Evidentemente una diferencia enorme.

A partir de ahí, hablé con colegas con los que estaba realizando un proyecto internacional. En una semana lanzamos encuestas a Italia, Estados Unidos, Reino Unido, con resultados parecidos que mostraba que había muchos más casos que los detectados oficialmente. 

Empezamos entonces a reclutar más personas y ampliar los lugares en que hacíamos la encuesta que tiene sólo dos preguntas: ¿cuánta gente conoces? ¿De la gente que conoces, cuánta gente tiene o ha tenido síntomas del Covid 19? 

Al utilizar ese ratio de la división entre número de casos por población extrapolando a toda la población, se obtenía una estimación de cuál es el porcentaje de la población que había estado infectado. 

Nos topamos con la ley de privacidad de los datos: por lo que no podemos tener un perfil de la gente que nos responde, no tenemos garantía que estamos cubriendo todo el espectro demográfico de una región o un país. 

La encuesta cogió fuerza y hoy hay gente participando de todos los países y, en 150 de ellos, tienen la posibilidad de responder a nivel regional o nacional. Coronasurveys está traducida a 60 idiomas. 

¿Es un problema atraer a las personas para que respondan a la encuesta? 

Sí. En España a base de utilizar muchos contactos tenemos el orden de varios miles de respuestas. Lo bueno es que cada respuesta nos da información de tantos contactos como esa persona dice que conoce. Mientras, en la mayoría de las encuestas se están haciendo (como la de la Universidad de Maryland en colaboración con Facebook, para obtener información de infectados con el Covid 19) cada respuesta solo proporciona información relativa a esa persona. 

Nosotros cuando alguien nos dice que conoce a 50 personas y que de esas 5 han sido infectadas, estoy obteniendo información de 50 personas. Eso tiene un efecto multiplicador. Entonces de media la gente nos está dando información de 50 a 100 personas por lo que 10 respuestas nos dan información de entre 500 a mil personas, que si esas 10 respuestas están medianamente bien distribuidas nos pueden dar información muy útil y completa. 

¿Cómo está funcionando la encuesta en España? 

Al día de hoy en España hay 600 mil casos confirmados oficialmente. El estudio serológico, realizado en abril, dijo que en España por lo menos un 5 por ciento de la población tenía anticuerpos por lo que ya había pasado la enfermedad. Entonces en efecto estamos hablando de más de 2 millones de personas. Lo que quiere decir que los 600 mil infectados están claramente muy por debajo de la realidad. Nuestras estimaciones están entre tres y cuatro millones ahora mismo. 

Ahora intentamos aumentar el ámbito de la encuesta para lograr saber no sólo cuánta gente ha pasado el virus, sino cuánta gente la ha cogido recientemente, para intentar hacer un seguimiento de la evolución de cuándo sube y cuándo baja. Así se podrían detectar rebrotes. Para ello, por ejemplo, estamos lanzando encuestas locales. En Madrid hemos lanzado una encuesta que cubre Rivas, sus tres distritos y Arganda, que son ciudades en la periferia de Madrid y son zonas con entre 20 y 40 mil personas cada una. Nos ayudan organizaciones locales, asociaciones, etc. Y están logrando que entre 10 a 20 personas diariamente nos respondan la encuesta, lo que nos está permitiendo hacer un seguimiento de en qué áreas de esas cuatro zonas están subiendo los casos. Así se pueden hacer estimaciones lo que nos permite prevenir el avance de la epidemia. En Rivas el número de infectados está por sobre el 2,5 lo que es muy preocupante.

La última encuesta que tenemos de Chile nos dice que hay un 6 por ciento de la población chilena infectada. Pero esta forma de calcular no es demasiado fiable porque el número de respuestas que tenemos no es demasiado alta. Por eso queremos que más gente en Chile haga la encuesta. 

La zona de Rivas no está dentro de los 37 distritos con confinamiento que tiene actualmente Madrid. 

No. No está dentro del plan. Ellos utilizan el caso de datos confirmados, pero en Madrid esa confirmación tarda más de dos semanas en ser entregadas a la población. A mi hermana la hicieron la PCR hace más de una semana y todavía no le dan los resultados. No saben la tendencia. Nuestros datos son a partir de las respuestas de ayer y hoy.

¿Cómo promocionan coronasurveys.org?

Tenemos aplicaciones para Android y iphone. Luego tenemos bastante participación en Brasil porque un trabajador de Facebook nos ha dado créditos para anunciar. Pero no hemos logrado una financiación real. Todo el trabajo lo hacemos robando tiempo de otras cosas, del tiempo libre y utilizando recursos de otros remanentes de investigaciones, con los que pago el servidor.

¿Cuántas personas trabajan contigo? 

Los traductores son como 200 y el equipo somos como 30. 

Estoy muy contento porque hemos logrado hacer el proyecto a una escala muy amplia, pero, a la vez un poco decepcionado por no tener más respuestas, más participación. Es difícil llegar a la gente. Hemos aumentado cuando algunos medios nos han anunciado. En Ucrania, una “influencer” publicitó que habíamos abierto la encuesta y recibimos en pocos días miles de respuestas. 

Los partidos opositores culpan al gobierno español de ocultar las cifras. ¿Según su encuesta es eso así? 

Las estimaciones oficiales de muertes y casos CCFR (corrected fatality ratio) y las de la encuesta son muy diferentes. La línea verde en nuestra página muestra el número de casos confirmados y la amarilla indica nuestra estimación de casos activos. En muchos países los datos oficiales no son fiables. En Ucrania el número de muertes a partir de encuesta y oficial nos da entender que hay algo raro allí.

Aquí el diario El País habla de 40.000 muertes.  Utilizan las cifras del Instituto de Salud de la Universidad Carlos III, que entrega dos cifras: una de muertes por Covid, en las que se incluyen muertes confirmadas por Covid, y la otra es muerte en exceso, cuántos datos hay por encima de la tendencia de años pasados, las que eran de esperar. Si normalmente mueren 10 mil personas al año y este año hay 50 mil muertes, es que hay 40 mil en exceso. Hoy esa cifra está entre 40 y 45 mil personas.

¿Se puede hablar de politización de las cifras? 

¡Por supuesto! Estas cifras están siendo utilizadas políticamente. La gente más cercana al gobierno dice que son 30 mil y la gente más contraria al gobierno dice que son 50 mil. La realidad es que entre los 20 mil de diferencia, es probable que haya muchos que murieron de Covid, pero no se les pudo hacer una prueba para probarlo y otros han muerto no de Covid sino por el Covid. Por ejemplo, una persona que tiene un infarto en la calle y no hay una UCI o cama en el hospital para tratarlo y muere. En una ocasión normal lo podrían haber tratado. Esos 20 mil incluyen los dos tipos, los que murieron por el Covid y otros por que no pudieron ser tratados. En el verano, al haber una ola de calor, puede que alguna de esas muertes se deban a ello. En cualquier caso, el problema es que hay un baile de números y cifras enormes y es muy difícil tener certeza de cuándo uno tiene las cifras de verdad reales.

Nosotros lo que queremos con este proyecto no es dar una cifra exacta porque no podemos. Pero si queremos dar cifras más cercanas a la realidad de las que se manejan actualmente, como los 600 mil en España que es irreal.

Obviamente lo ideal sería contar uno a uno lo casos, pero como no hay capacidad para hacerlo, tenemos que buscar otra manera. Ahora mismo estamos trabajando con lo que disponemos, intentando coger datos de aquí y allá,  dar la respuesta y aproximar. Ese es nuestro objetivo y ayudar en lo que podamos. 

¿Como daña la obtención de datos la politización de las cifras? ¿Llegaremos a saber cuánta gente realmente murió del Covid? 

Nunca llegaremos a saber cuántos muertos dejó el Covid, porque será imposible saber si todos los que han muerto es por el virus u otras causas. A muchos de los que están enterrados no se les hicieron las pruebas porque no había cómo hacerlas. Los incinerados, es imposible recuperar esos datos. Vamos a poder tener datos sobre los estragos del Covid cuando se tenga una técnica fiable y se aplique a toda la población. 

Nuestra encuesta en ese sentido no es fiable porque preguntamos por síntomas, sabemos que hay enfermedades que pueden dar sintomatología parecida como la propia gripe, y cuando entremos en la época de gripe puede que haya gente que diga si, conozco a gente con síntomas y resulte que es gripe. Eso es imposible de evitar. Otro que no podemos captar son los asintomáticos. Sin embargo, el número de personas asintomáticas se va a reducir porque se están haciendo muchas PCR, muchos tests, dos fenómenos que tiran sentido contrario. 

Nuestras estimaciones no están más allá del doble o la mitad del dato real, pero es un error mucho menor que decir que hay 600 mil cuando hablamos de tres o cuatro millones fácil. 

Entonces cuando ves los informe oficiales te dan ganas de pegarte contra una pared... 

¡Totalmente! 

¿Han ofrecido su encuesta al gobierno? 

Si. Hablé con dos personas asesores del Ministerio de Salud y el problema que rápidamente ven es que el método no es fiable porque no se tiene control de la muestra. Eso es cierto, pero los distintos departamentos del gobierno si tienen la capacidad de utilizar la misma técnica como nosotros para hacerlo. Para mí es muy fácil asesorar una ciudad y decirles “vamos a tomar el censo de la población, vamos a elegir al azar a 50 personas y vamos a llamar por teléfono a esas 50 personas y que me den la información que yo recabo en mi encuesta. Con esas personas, en una población de 100 mil habitantes tenemos una imagen muy buena de lo que está pasando. Si elegimos a 50 personas en forma geográficamente para que cubran a toda la ciudad y en rango de edad, red social con eso logras cubrir la población. Mi problema es que ni mi instituto ni yo, tenemos acceso al censo y me han pedido que no recopile datos personales para mantener la privacidad de quienes responden, porque son datos delicados. 

El gobierno si tiene esos datos.

 Claro o incluso el municipio. Creo que tienen tantos voluntarios ofreciendo cosas que es muy difícil ver que es útil y que no lo es. Es muy complicado. Se están haciendo tantos modelos, tantos científicos estamos aportando teorías. Sólo somos uno más. Las estimaciones, cuando las hemos contrastados con otras, son buenas, pero no quiero convencer que lo que hacemos es la verdad absoluta. 

¿Cómo evalúas las encuestas que entrega la Universidad Jhon Hopkins, que publica números todos los días? 

Ellos no tienen una encuesta, sino una recopilación de los datos oficiales obtenidos de fuentes oficiales. Para España muestran los 600 mil casos confirmados de contagio y de 30 mil muertes. No tiene otros datos. Pero los muestran en gráficos muy bonitos. Nosotros no los utilizamos, sino los datos entregados por el Centro Europeo de Control de Epidemia, que tiene básicamente datos similares.