banner

Notícias

Oct 05, 2023

Aproveitando dados clínicos em instituições de saúde para aprendizado contínuo de modelos preditivos de risco

Scientific Reports volume 12, Número do artigo: 8380 (2022) Citar este artigo

Acessos 2018

5 Citações

11 Altmétrica

Detalhes das métricas

A flexibilidade inerente dos modelos preditivos clínicos baseados em aprendizado de máquina para aprender com episódios de atendimento ao paciente em uma nova instituição (treinamento específico do local) vem com o custo da degradação do desempenho quando aplicado a coortes externas de pacientes. Para explorar todo o potencial do big data clínico interinstitucional, os sistemas de aprendizado de máquina devem obter a capacidade de transferir seu conhecimento além das fronteiras institucionais e aprender com novos episódios de atendimento ao paciente sem esquecer os padrões aprendidos anteriormente. Neste trabalho, desenvolvemos um algoritmo de aprendizado de preservação da privacidade chamado WUPERR (Weight Uncertainty Propagation and Episodic Representation Replay) e validamos o algoritmo no contexto da previsão precoce de sepse usando dados de mais de 104.000 pacientes em quatro sistemas de saúde distintos. Testamos a hipótese de que o algoritmo de aprendizado contínuo proposto pode manter um desempenho preditivo mais alto do que os métodos concorrentes em coortes anteriores, uma vez que tenha sido treinado em uma nova coorte de pacientes. Na tarefa de previsão de sepse, após o treinamento incremental de um modelo de aprendizado profundo em quatro sistemas hospitalares (ou seja, hospitais HA, HB, HC e HD), o WUPERR manteve o maior valor preditivo positivo nos três primeiros hospitais em comparação com uma abordagem de aprendizado de transferência de linha de base (HA: 39,27% vs. 31,27%, HB: 25,34% vs. 22,34%, HC: 30,33% vs. 28,33%). A abordagem proposta tem o potencial de construir modelos mais generalizáveis ​​que podem aprender com big data clínico interinstitucional de maneira a preservar a privacidade.

O notável ressurgimento da inteligência artificial e seu impacto na automação industrial, otimização da satisfação do cliente e receita na última década resultou em um interesse crescente na aplicação de tecnologias relacionadas à saúde1,2,3. Em particular, as técnicas de aprendizado profundo ganharam maior atenção na medicina clínica, incluindo triagem e triagem, diagnóstico, prognóstico, suporte à decisão e recomendação de tratamento4,5,6,7,8,9,10,11,12,13. Para obter ampla adoção clínica, os modelos clínicos baseados em aprendizado profundo devem ser generalizáveis ​​e portáteis e garantir a privacidade dos pacientes cujos dados são usados ​​para treinamento e avaliações de modelos14,15. Na prática, os modelos treinados com dados de um único sistema de saúde muitas vezes sofrem de falta de generalização devido a diferenças na demografia local, equipamentos de laboratório e ensaios, registros eletrônicos de saúde (EHR), frequência de medição de dados e variações nas práticas clínicas e administrativas, incluindo codificação e definições de vários diagnósticos clínicos16. Argumentou-se que o big data clínico, quando combinado com a flexibilidade inerente dos modelos de aprendizado profundo para aprender com novos dados/experiências, poderia, em teoria, abordar parte dessa heterogeneidade. No entanto, os dados de saúde permanecem isolados e a acessibilidade dos dados e a privacidade do paciente representam um desafio substancial para alavancar totalmente o poder da análise avançada no domínio da saúde15,17. Como tal, nos dias atuais, os dados clínicos típicos utilizados para o desenvolvimento de modelos são frequentemente várias ordens de grandeza menores do que aqueles que alimentam as aplicações industriais de aprendizado profundo18.

Uma recente validação independente e externa de uma pontuação de risco de previsão de sepse baseada em aprendizado de máquina amplamente utilizada destacou a questão da generalização do modelo na presença de mudança na distribuição de dados e mudanças na combinação de casos da população19,20. Uma solução potencial para melhorar a validade externa dos sistemas de aprendizado profundo é ajustar esses modelos em cada novo ambiente de atendimento (também conhecido como Transfer Learning)21,22. No entanto, essa abordagem pode resultar em muitas versões do mesmo algoritmo operando em diferentes configurações de cuidado, o que levanta preocupações regulatórias em relação à gestão de mudanças e desafios científicos em relação à produção de conhecimento generalizável23. Portanto, é desejável projetar algoritmos e modelos de aprendizado que possam aproveitar os dados do paciente em diversas coortes de pacientes de maneira a preservar a privacidade e com planos de controle de alterações bem definidos24 que possam manter um desempenho aceitável enquanto gerenciam o risco potencial para os pacientes.

COMPARTILHAR