Busca avançada
Ano de início
Entree
(Referência obtida automaticamente do SciELO, por meio da informação sobre o financiamento pela FAPESP e o número do processo correspondente, incluída na publicação pelos autores.)

Machine learning para análises preditivas em saúde: exemplo de aplicação para predizer óbito em idosos de São Paulo, Brasil

Texto completo
Autor(es):
Hellen Geremias dos Santos [1] ; Carla Ferreira do Nascimento [2] ; Rafael Izbicki [3] ; Yeda Aparecida de Oliveira Duarte [4] ; Alexandre Dias Porto Chiavegatto Filho [5]
Número total de Autores: 5
Afiliação do(s) autor(es):
[1] Universidade de São Paulo. Faculdade de Saúde Pública - Brasil
[2] Universidade de São Paulo. Faculdade de Saúde Pública - Brasil
[3] Universidade Federal de São Carlos. Centro de Ciências Exatas e de Tecnologia - Brasil
[4] Universidade de São Paulo. Escola de Enfermagem - Brasil
[5] Universidade de São Paulo. Faculdade de Saúde Pública - Brasil
Número total de Afiliações: 5
Tipo de documento: Artigo Científico
Fonte: Cadernos de Saúde Pública; v. 35, n. 7 2019-07-29.
Resumo

Este estudo objetiva apresentar as etapas relacionadas à utilização de algoritmos de machine learning para análises preditivas em saúde. Para isso, foi realizada uma aplicação com base em dados de idosos residentes no Município de São Paulo, Brasil, participantes do estudo Saúde Bem-estar e Envelhecimento (SABE) (n = 2.808). A variável resposta foi representada pela ocorrência de óbito em até cinco anos após o ingresso do idoso no estudo (n = 423), e os preditores, por 37 variáveis relacionadas ao perfil demográfico, socioeconômico e de saúde do idoso. A aplicação foi organizada de acordo com as seguintes etapas: divisão dos dados em treinamento (70%) e teste (30%), pré-processamento dos preditores, aprendizado e avaliação de modelos. Na etapa de aprendizado, foram utilizados cinco algoritmos para o ajuste de modelos: regressão logística com e sem penalização, redes neurais, gradient boosted trees e random forest. Os hiperparâmetros dos algoritmos foram otimizados por validação cruzada 10-fold, para selecionar aqueles correspondentes aos melhores modelos. Para cada algoritmo, o melhor modelo foi avaliado em dados de teste por meio da área abaixo da curva (AUC) ROC e medidas relacionadas. Todos os modelos apresentaram AUC ROC superior a 0,70. Para os três modelos com maior AUC ROC (redes neurais e regressão logística com penalização de lasso e sem penalização, respectivamente), foram também avaliadas medidas de qualidade da probabilidade predita. Espera-se que, com o aumento da disponibilidade de dados e de capital humano capacitado, seja possível desenvolver modelos preditivos de machine learning com potencial para auxiliar profissionais de saúde na tomada de melhores decisões. (AU)

Processo FAPESP: 17/09369-8 - Predição de óbitos segundo causa básica com machine learning em uma amostra longitudinal de 502.632 indivíduos
Beneficiário:Alexandre Dias Porto Chiavegatto Filho
Modalidade de apoio: Auxílio à Pesquisa - Regular