-
Notifications
You must be signed in to change notification settings - Fork 23
En busca de los fallecidos perdidos
(Actualizado: 07/12/2020)
Si has llegado hasta aquí, podrás encontrar algunas ideas sobre:
- Los fallecidos son material sensible
- ¿Qué fallecidos se están contando: a nivel nacional (I)?
- ¿Qué fallecidos se estan contando a nivel autonómico y provincial: escovid19data?
- ¿Son fiables los datos de fallecidos en escovid19data?
- Comparación de los datos de escovid19data con los de Sanidad
- ¿Por qué hay discrepancias en algunas CCAA (Cataluña, Madrid, País Vasco, Castilla y León)
- (En el futuro): las extrapolaciones con otras fuentes nacionales de fallecidos
El número de fallecidos por Covid en España es, sin duda, el dato más sensible de la pandemia en el país. Y, como todos los datos, ha sido empleado para múltiples usos: unos mejores, y otros, mejorables.
Sin ir más lejos, en la primera ola, existieron serias dudas sobre cómo se estaban contando los fallecidos en España. En España, el criterio "oficial" era, y es, contar solo los casos expresamente identificados (mediante una prueba, ya sea un PCR o un test de antígenos).
Por su parte, la OMS estableció unos criterios para contar el número de casos por Covid-19, incluyendo además los casos "sospechosos"
Pero, no solo en España, sino en muchos otros países, la forma de contar los fallecidos] es diferente.
A continuación, se muestran las distintas fuentes, indicando con un número entre corchetes (por ejemplo, [1]) la primera referencia a cada una de ellas.
En España, existen varias fuentes sobre (no solo) el número de fallecidos. A nivel nacional, la más conocida es el ya clásico informe diario (de lunes a viernes) del Ministerio de Sanidad (Sanidad [1]), y en concreto, del CCAES. Se ofrece en formato PDF (por ejemplo, el informe del 29 de noviembre de 2020).
Ese informe se elabora así, según el propio Ministerio:
El presente informe se ha realizado con los datos individualizados notificados por las CCAA a la Red Nacional de Vigilancia Epidemiológica (al sistema SiViEs). Se incluyen los casos [...] que [...] fallecieron con diagnóstico clínico de COVID-19, de acuerdo a las definiciones de caso vigentes en cada momento. Cualquier futura actualización que realicen las CCAA quedarán reflejadas en los informes diarios.
Eso significa:
- que esos datos solo se dan por comunidades autónomas (CCAA).
- que solo se tienen en cuenta los casos confirmados (¿previamente?) como COVID-19.
- que esos datos se comunican por las CCAA (CCAA), de forma individualizada, a RENAVE, la Red Nacional de Vigilancia Epidemiológica que comparten Sanidad y las CCAA (mediante el SiViEs)
- y que esos datos pueden cambiar (si las CCAA lo actualizan en el SiViEs en días posteriores).
Por otra parte, Sanidad ha ido ofreciendo históricos sobre el número de fallecidos, por CCAA:
-
durante meses, lo ofrecía justo a continuación de los datos de fallecidos [2], mediante un enlace desde el informe diario, junto a los datos de fallecidos (al final de la página 5, normalmente).
-
y desde el 19 de noviembre de 2020, Sanidad ha integrado un fichero histórico actualizado (se supone) en formato CSV que también incluye, junto al número de fallecidos, el número de casos, de hospitalizados y de personas en la UCI. Se puede encontrar ese enlace al final de la explicación inicial del PDF, página 1.
Es decir, el PDF original ofrece una foto diaria que podría luego variar, si se revisaba ese fichero histórico, al cmabo de unos días.
La información de Sanidad proviene de las CCAA, pero solo ofrece datos a este nivel de agregación. Es decir, que compara la realidad de toda una CCAA (ya sea Andalucía o La Rioja), pero no desagrega por provincias.
Esa información es ofrecida en cada CCAA, de forma distinta y diversa. De ahí surgió escovid19data, que recoge los datos directamente de cada CCAA, a diario y por provincia, incluyendo el número de fallecidos (entre otros datos).
A partir de esos datos, @numeroteca, además de coordinar , actualiza diariamente un sitio web con numerosos recursos basados en estos datos, Por ejemplo:
- Mediante tablas por CCAA de:
- Mediante tablas por provincias de:
-
Mediante gráficos interactivos de fallecidos por CCAA y provincia, tanto de forma lineal como logarítmica.
-
Mediante gráficos estáticos de fallecidos por día (en los últimos 50 días), como en el ejemplo de Castilla y León
-
Mediante rejillas de comparación de fallecimientos de comunidades y provincias, ya sean:
- fallecimientos por día](url)
- fallecimientos acumulados por provincia
-
Mediante **mapas** históricos animados con el número de fallecidos por millón de habitantes, por provincia
-
O mediante las trayectorias o relaciones entre:
- el número de casos y el número de fallecidos
- el número de fallecidos en la última semana y el total de fallecidos.
Escovid19data toma los datos que publican cada día, las CCAA en sus diversas fuentes (*). Puedes acceder a las mismas (que han ido variando a lo largo de la pandemia) en el fichero diario de datos que escovid19data compila (al final de los datos de cada día).
Las preguntas que están en el aire son:
-
¿Esos datos pueden variar en el futuro? Es decir, ¿es posible que las CCAA reporten posteriormente un número mayor de datos de los que indican a un día concreto?
-
¿Cómo se comparan esos datos con los que ofrece Sanidad?
Esta pregunta es complicada de responder: muchas de las CCAA no ofrecen un histórico de sus fallecidos, sino solo los datos diarios.
Había una pregunta pendiente: ¿es posible que las CCAA reporten posteriormente un número mayor de datos de los que indican a un día concreto?
Esta pregunta es complicada de responder: muchas de las CCAA no ofrecen un histórico de sus fallecidos, sino solo los datos diarios.
(Pendiente: revisar qué CCAA sí incluye ese histórico, y cuáles no).
Hemos comparado tanto los distintos datos de los PDF de Sanidad (que han sido obtenidos mediante scraping por @mharias) como los datos del CSV histórico de Sanidad (a 28/11/2020).
Eso suponía resolver varias preguntas:
-
¿Ese CSV está realmente actualizado respecto al PDF?
-
Si lo está, ¿cómo son los datos de escovid19data? ¿Más actualizados? ¿Igual? ¿Menos?
Analizando los datos hasta el 26 de noviembre de 2020, según @mharias y @numeroteca , los datos del fichero histórico del CSV están más actualizados.
Ello puede comprobarse porque la diferencia, en el acumulado de casos, que es muy similar en muchas comunidades, es positiva en la mayoría de las que han tenido diferencias, es decir, se han añadido casos en el CSV de algunas comunidades.
Fuente: @mharias
A continuación, hemos comparado los datos de fallecidos acumulados de escovid19data con los datos de fallecidos acumulados del CSV histórico de Sanidad.
Hemos hecho la comparación porque, como se ha descrito, los datos del CSV son, a medio plazo, más fiables. Y éste es el resultado:
Fuente: @mharias
Puede comprobarse que los datos coinciden en buena parte de las CCAA: es decir, que los datos que ofrecen diariamente cada una de ellas coinciden, a medio plazo, con los que ofrece Sanidad.
En otras palabras: en buena parte de las CCAA, los datos de escovid19data son más "reales" (acaban coincidiendo con los del CSV de Sanidad) que los datos que ofrece, a corto plazo, el Ministerio de Sanidad (en su PDF). Una hipótesis es que las CCAA sí reporten el número total de casos, pero no reporten todos los datos de cada uno y, por lo tanto, Sanidad no los dé por buenos hasta que no hayan sido completados.
No obstante, esto no ocurre en todas las CCAA: algunas de ellas sí presentan discrepancias entre los datos de escovid19data y los datos de Sanidad. Se describen a continuación cuáles son y algunas posibles causas.
Existen dos tipos de discrepancias: mayores (los datos tienen grandes variaciones) y menores (que pueden deberse a algunos ajustes). Han de tenerse en cuenta las escalas de los gráficos.
Cataluña es la gran excepción: el número de fallecidos que reporta esta comunidad (y que recoge escovid19data) es el doble de los datos que se reflejan en Sanidad. Así puede observarse en la gráfica:
Fuente: @mharias
Ello tiene una razón: Cataluña llama a los fallecidos "defunción", y las entiende como:
las defunciones relacionadas con la COVID-19: que el motivo en el certificado de defunción especifique que la persona ha muerto a causa de la COVID-19 tenga o no una PCR/TA+.
Es decir, que incluye a personas que no han sido diagnosticadas expresamente con Covid-19, pero que, en su acta de defunción, han sido catalogadas como tal.
Fuente: Dades Covid, Generalitat de Catalunya
Para ello, toma en cuenta el antes mencionado criterio de la OMS.
No obstante, si se observa el gráfico de Cataluña, las dos gráficas (en azul, escovid19data, es decir, datos de Salut (la consejería encargada del tema en Cataluña); y en rosa, Sanidad) son prácticamente paralelas. El salto se produce entre finales de abril y finales de mayo, cuando se duplican los datos de Salut, para luego seguir una evolución muy similar.
Más sorprendente es que, contando los fallecimientos según el propio criterio de Sanidad, es decir, comparando los datos publicados en el PDF (actualización diaria) con los datos obtenidos en el CSV (que refleja el histórico), ha habido una discrepancia continua de casos entre ambos hasta muy recientemente: entre 1000 y 1500 casos no completamente actualizados hasta fechas muy recientes.
Por su parte, Madrid opta en sus propios datos por ofrece distintas cifras sobre fallecimientos, como se observa aquí:
Fuente: Salud Madrid, 29/11/2020
Por un lado, ofrece los datos de fallecidos en hospitales ("Fallecidos Hospitales, a la izquierda"), se supone, con confirmación de diagnóstico con Covid-19, es decir, como pide Sanidad.
Pero a continuación, ofrece los datos de fallecidos marcados así en su certificado de defunción. Se observa que el número de fallecidos de este tipo aumentaría en torno a un 50% el número de fallecidos.
El dato de Sanidad es más próximos al de "Fallecidos Hospitales", como se observa en el gráfico. No obstante, ha de observarse la escala: la diferencia actual está en torno a los 200 fallecidos, que todavía no han sido incorporados a SiViEs. No queda claro si los fallecidos en otras ubicaciones han sido o no incorporados a SiViEs, por ejemplo, porque no tengan una confirmación de Covid.
En el caso de Castilla y León, hay una trayectoria inversa a la de Cataluña, y única en toda España:
- Los datos de Sanidad son mayores que los de esCovid19data
- Pero ambas trayectorias de fallecimientos acumulados son paralelas: se bifurcan a finales de abril (¿coincidiendo con algún cambio de criterio?) y a partir de ahí, se comportan de la misma manera.
El País Vasco esconde un caso particular: a nivel de CCAA, sus propios datos sobre fallecimientos coinciden más o menos, tarde o temprano, con los que ofrece Sanidad.
Sin embargo, el desglose de datos por provincias (que sí se ofrece en todas las demás comunidades) no se publica (se explica en detalle en este post). Se publica:
- Serie de fallecidos acumulados para todo Euskadi. Acumulados diarios del 24/02/2020 al 15/07/2020. Luego los datos pasan a publicarse semanalmente ¿por qué?
- Serie de fallecidos diarios para todo Euskadi: “Casos positivos fallecidos en Euskadi por fecha de fallecimiento”. Datos diarios desde el 01/03/2020.
- Serie de fallecidos diarios por hospitales en Euskadi. Datos diarios desde el 01/03/2020 desagregados por hospitales.
- Acumulados de fallecidos en cada municipio de Euskadi. No se ofrece la serie de datos temporales, se da el dato de la última fecha disponible con periodicidad semanal. @numeroteca, que es madrina de esta CCAA, analiza en este post se explica cómo se ha calculado la serie por provincias a partir de estos datos.
Queda pendiente (para un análisis futuro) una revisión de estos datos con dos extrapolaciones a nivel autonómico... hechas por fuentes nacionales:
-
ISCIII: MoMo: análisis de las muertes estimadas vs. muertes ocurridas en España, comparando con datos de años anteriores, por CCAA: https://momo.isciii.es/public/momo/dashboard/momo_dashboard.html#datos
-
INE. Defunciones semanales, acumuladas y variación interanual del acumulado. Total nacional y provincias. 2020-2020
Y ver qué podemos comparar de los datos que tenemos (por CCAA y por provincias) respecto a los fallecimientos que hay...