Um novo modelo de aprendizado de máquina pode ajudar as autoridades de saúde pública a se antecipar à próxima crise
Diagnosticar e conter um surto de doença, ou os efeitos na saúde de um evento perturbador como um desastre natural, pode ser uma tarefa enorme. Um estudo divulgado na sexta-feira pela Universidade de Nova York sugere que um novo modelo de aprendizado de máquina pode melhorar a capacidade das autoridades de saúde de responder a futuras pandemias e outras crises de saúde pública.
A pesquisa foi feita em parceria com a Carnegie Mellon University e o Departamento de Saúde e Higiene Mental da cidade de Nova York.
Kimberly Adams, do Marketplace, fala com Daniel Neill, professor de ciência da computação na NYU e diretor do Machine Learning for Good Laboratory, que divulgou o estudo. Ele explica como funciona esse modelo de aprendizado de máquina. O que se segue é uma transcrição editada de sua conversa.
Daniel Neill: Nossa abordagem usa dados textuais de visitas ao departamento de emergência. Então, em particular, a principal razão pela qual o paciente veio ao pronto-socorro. E esses dados textuais contêm dados muito mais ricos do que apenas "uma pessoa tem sintomas semelhantes aos da gripe". Podemos saber exatamente que tipo de sintomas eles têm ou a que foram expostos e, assim, ao detectar padrões nesses dados textuais, podemos revelar novos surtos, coisas que a saúde pública ainda não estava procurando, bem como outros tipos de problemas. eventos.
Kimberly Adams:Como esse algoritmo pode ser implantado em um departamento de saúde para talvez identificar surtos de doenças novas ou não identificadas?
Neill: A esperança é que os departamentos de saúde pública realmente executem esse tipo de abordagem diariamente, onde a cada dia o algoritmo traz à tona clusters no passado, digamos, 24 horas de dados que a saúde pública pode examinar e, se necessário, responder a. Também pode ajudar a saúde pública a lidar com todas as inúmeras coisas com as quais eles precisam lidar diariamente, que podem ser um conjunto de casos provenientes de inalação de fumaça, ou algum tipo de exposição química, ou estamos vendo um novo grupo de overdoses de drogas por causa de alguma nova droga sintética. Então, novamente, o objetivo é dar-lhes conhecimento diário de tudo o que está acontecendo em sua jurisdição.
Adams:Então, talvez você possa identificar, não sei, um surto de algo como a doença dos legionários mais cedo do que faria de outra forma?
Neill: Sim, está certo. Esse é um bom exemplo de algo com sintomas raros. E você também pode imaginar se algo aparecer com novos sintomas, coisas que nunca vimos antes, como fazer com que o nariz das pessoas fique azul e caia. Agora, não deve demorar muitos casos de algo assim para percebermos que temos algo novo e diferente com o qual a saúde pública precisa lidar. Mas a ironia é que os sistemas típicos de vigilância de doenças irão apenas mapeá-los para suas categorias de síndrome existentes e, essencialmente, perder o fato de que realmente há algo novo lá. Portanto, o que fornecemos é uma rede de segurança para detectar todos os tipos de eventos que outros sistemas podem perder.
Adams:O que acontece se houver um lapso nos dados ou simplesmente não houver pessoas falando sobre seus sintomas?
Neill: Isso mesmo. Isso é absolutamente uma limitação do sistema, que depende da qualidade, disponibilidade e pontualidade dos dados. Assim, por exemplo, se uma jurisdição não está obtendo dados do departamento de emergência de hospitais locais em tempo hábil, isso afetará toda a sua capacidade de responder a quaisquer padrões nesses dados. Da mesma forma, se houver erros graves na forma como os dados foram coletados, eles têm o potencial de se propagar para o que podemos detectar usando esses dados. Além disso, você está absolutamente certo, coisas que podem não resultar em visitas ao departamento de emergência não seriam necessariamente detectáveis por meio dessa fonte de dados específica. Há, no entanto, uma grande variedade de fontes de dados que a saúde pública usa para detecção de surtos.
Adams: Uma das maneiras pelas quais vocês testaram esse algoritmo foi observando os dados que chegaram aos hospitais após o furacão Sandy. Você pode me explicar o que viu e como o algoritmo respondeu a isso?