banner

Notícias

Sep 11, 2023

O aprendizado de máquina identifica regras diretas de alerta precoce para surtos humanos de hantavírus Puumala

Scientific Reports volume 13, Número do artigo: 3585 (2023) Citar este artigo

523 acessos

2 Altmétrica

Detalhes das métricas

As infecções pelo vírus Puumala humano (PUUV) na Alemanha flutuam plurianualmente, seguindo as flutuações do tamanho da população de ratazanas do banco. Aplicamos uma transformação aos valores de incidência anual e estabelecemos um método heurístico para desenvolver um modelo robusto direto para o risco de infecção humana binária no nível distrital. O modelo de classificação foi alimentado por um algoritmo de aprendizado de máquina e alcançou 85% de sensibilidade e 71% de precisão, apesar de usar apenas três parâmetros climáticos dos anos anteriores como entradas, a saber, a temperatura do solo em abril de dois anos antes e em setembro do ano anterior. ano, e a duração do sol em setembro de dois anos antes. Além disso, introduzimos o índice de surtos de PUUV que quantifica a sincronia espacial dos surtos locais de PUUV e o aplicamos aos sete surtos relatados no período 2006-2021. Por fim, usamos o modelo de classificação para estimar o PUUV Outbreak Index, atingindo 20% de incerteza máxima.

As condições ambientais desencadeadas pelas mudanças climáticas desempenham um papel cada vez maior na disseminação de doenças infecciosas zoonóticas, alterando os habitats naturais dos animais, influenciando a disponibilidade de alimentos e até mesmo provocando mudanças na distribuição das espécies. Dentro dessa estrutura, desenvolvemos um modelo simples baseado no clima para o risco de infecção humana por Puumala Orthohantavirus (PUUV) na Alemanha.

O PUUV é o hantavírus mais comum na Europa, transmitido por ratazanas de banco (Clethrionomys brilhoolus, sin. Myodes brilhoolus). A UVUP pode causar febre hemorrágica leve a moderada com síndrome renal (nefropatia epidêmica) com taxa de letalidade de 0,1–0,4%1. As infecções humanas por PUUV flutuam plurianualmente. Recentemente, houve vários anos com \(>{1000}\) casos anuais relatados na Alemanha2, geralmente e em grande escala impulsionados pela intensidade do mastro de faia (Fagus spec.), como mostrado no passado para a Bélgica3,4 e para a Alemanha5 ,6.

Os mecanismos subjacentes para a taxa de transmissão de PUUV para humanos parecem muito complexos para serem modelados diretamente, já que dependem da abundância das populações de ratazanas de banco, sua prevalência de PUUV e a interação homem-ratoide de banco; todos os quais flutuam temporalmente e variam localmente. No entanto, as condições climáticas podem ser usadas como preditores para o risco de infecção humana por PUUV, porque a flutuação nas populações de ratazanas de banco se correlaciona fortemente com os parâmetros climáticos dos dois anos anteriores7, enquanto a prevalência de PUUV depende principalmente da abundância de ratazanas de banco3,8, 9.

Selecionamos distritos alemães com números significativos de infecções humanas e incidência em 2006-2021 e inspecionamos as correlações da incidência anual de PUUV com parâmetros climáticos mensais no nível distrital. Realizamos uma transformação de dados que destaca a sincronia espacial da flutuação temporal da incidência de PUUV. Esta transformação permitiu desenvolver um modelo de classificação binária baseado em máquinas de vetores de suporte (SVM) para os surtos distritais, aplicável em todo o país e baseado apenas em parâmetros meteorológicos de fácil acesso. Além disso, introduzimos o índice de surto de PUUV (POI) como um indicador para o risco anual de infecção por PUUV em humanos. O POI permite uma definição inequívoca de um surto de PUUV pela primeira vez, considerando a magnitude local da incidência de PUUV. A definição de POI é independente do total de infecções anuais, mas seus valores são altamente correlacionados. Por fim, aplicamos o modelo de classificação binária ao POI e mostramos que apenas três valores de parâmetros meteorológicos são suficientes para dar uma boa estimativa. O modelo POI combinado pode ser aplicado como uma regra simples para a detecção de anos de alto risco. Tal modelo pode ser usado para interpretar os surtos de PUUV, mas também para obter aproximações sobre a dinâmica dos roedores. Isso é muito importante para apoiar estratégias e decisões para a proteção da saúde humana e das plantas.

{900}\) total reported infections in the selected districts have a POI value of \(>\text{50\%}\)./p>\text{77\%}\) and precision \(>\text{67\%}\) (Fig. 3a,b). Weather parameters are for the most part spatially uniform. Thus, the observations from each year formed clusters in the 3D input space of our model. The values of the weather variables for these "cluster centers" were the annual average values over whole Germany./p>\text{90\%}\) was achieved, i.e., 2012 from the outbreak years, and 2008, 2011, 2013, 2016, 2018 and 2020 from the non-outbreak years. The lowest annual accuracy was 41% for 2015 (39 FP), followed by 65% for 2021 (12 FP and 11 FN). For 2014, the only wrong classifications were false negatives (15 FN, 77% accuracy). The highest accuracy was achieved in Baden-Württemberg (90%), and the lowest in North Rhine-Westphalia (66%) and Lower Saxony (69%). There were 6 districts from Baden-Württemberg, 2 from Bavaria, and 1 from Hesse with 100% accuracy. Another 15 districts had only one false classification (9 FP and 6 FN). The maximum numbers of false negatives came from the districts of Borken and Bentheim, with 7 FN and 6 FN, respectively. Borken also had the lowest accuracy among the districts with 44% (7 FN and 2 FP)./p>-\text{0.03}\) (a positive distance means that the observation is above the boundary with respect to V1_ST_9; thus, there is high infection risk for that year) and for \({\text{distance}}_{\text{t}}<-\text{0.37}\) (a negative distance means that the observation is below the boundary with respect to V1_ST_9; thus, there is low infection risk for that year). We compared the groups’ means by a one-way ANOVA with the function f_oneway from the SciPy library14. Based on the F-value of 97 and p value of 1.1 × 10−7, we concluded that the means of the two groups were statistically significantly different./p>-\text{0.03}\)). For distances in the interval \(\text{[}-\text{0.37,}-\text{0.03]}\), where the step occurred and no observation was available, no estimate could be generated. With an uncertainty equal to three times the standard error of the mean, we could estimate the POI for the year \({\text{t}}\) as:/p>
COMPARTILHAR