Data Mining and Risk Analysis Supporting Decision in Brazilian Public Health Systems

2019

Raimundo Valter, Silas Santiago, Ronaldo Ramos, Mauro Oliveira, Luis Odorico M. Andrade, Ivana Cristina de H. C. Barreto

Abstract: Health data monitoring is a key activity to reduce maternal, neonatal and infant mortality rates. Data available in Brazilian health databases points that It is possible to predict death risk in early stages of gestation and newborn development. In this research, we consider the information availability still in gestational period to propose different death risk prediction models for this public of interest. We also detail the data mining process to apply machine learning-based techniques in death risk classification for maternal, neonatal and infant patients. We present an experiment pipeline to estimate average performance and evaluated machine learning models with different features combinations. Additionally, is shown a web service which provides multiple predictive models by information availability. Results shows Random Forest obtaining better performance when compared to the other machine learning methods. Index Terms—Brazilian health data, data mining, information availability

Resumo: O monitoramento de dados de saúde é uma atividade fundamental para reduzir as taxas de mortalidade materna, neonatal e infantil. Os dados disponíveis nas bases de dados de saúde brasileiras apontam que é possível prever o risco de morte nas fases iniciais da gestação e desenvolvimento do recém-nascido. Nesta pesquisa, consideramos a disponibilidade de informações ainda no período gestacional para propor diferentes modelos de predição de risco de morte para este público de interesse. Também detalhamos o processo de mineração de dados para aplicar técnicas baseadas em aprendizado de máquina na classificação de risco de morte para pacientes maternos, neonatais e infantis. Apresentamos um pipeline de experimentos para estimar o desempenho médio e avaliar modelos de aprendizado de máquina com diferentes combinações de recursos. Adicionalmente, é apresentado um serviço web que fornece múltiplos modelos preditivos por disponibilidade de informação. Os resultados mostram que o Random Forest obteve melhor desempenho quando comparado aos outros métodos de aprendizado de máquina. Termos de indexação—dados brasileiros de saúde, mineração de dados, disponibilidade de informações

Data Mining and Risk Analysis Supporting Decision in Brazilian Public Health Systems

2019

Raimundo Valter, Silas Santiago, Ronaldo Ramos, Mauro Oliveira, Luis Odorico M. Andrade, Ivana Cristina de H. C. Barreto

Gerenciar Consentimento de Cookies