Publicada em

11/02/2019

Leandro Alberto Lonardoni

265 – Redes neurais recorrentes para previsão de demandas assistenciais na saúde suplementar

Resumo

A utilização de grandes conjuntos de dados para auxiliar as empresas na tomada de decisão está muito em ênfase nos dias de hoje. O embasamento científico na análise e exploração dos dados tem inspirado estudos acadêmicos e gerado interesse das empresas públicas e privadas. A Ciência de Dados entra neste contexto como uma área de estudo em destaque e estratégica para as empresas que desejam criar diferencial competitivo e gerar novos negócios. Os principais avanços tecnológicos nesta área são: reconhecimento de imagem e voz, prevenção de crimes, robótica, diagnósticos médicos e tratamentos de saúde. A Saúde Suplementar é uma atividade importante a ser explorada no âmbito da Ciência de Dados, com aplicações na previsão de demandas assistenciais e identificação de fraudes e abusos em contas médicas. Os riscos inerentes a esta atividade exige transformações nos negócios das operadoras de planos de saúde e o estudo analítico dos dados históricos gerados por seus agentes são fundamentais para estas transformações. Este trabalho apresenta a construção de um modelo de aprendizagem de máquina que utiliza redes neurais recorrentes para realizar previsões de demandas assistenciais nas operadoras privadas de planos de saúde. A metodologia foi aplicada a um conjunto de dados proveniente de duas fontes: dados de demandas assistenciais ambulatoriais e dados meteorológicos da região de Maringá-PR, o que possibilitou comparar os resultados da previsão com e sem a utilização de dados meteorológicos. Na etapa de análise exploratória os dados iniciais foram estratificados resultando em novas variáveis para a construção do modelo. Os dados foram normalizados e as variáveis com alto grau de correlação foram identificadas. A partir disto, foram criados alguns cenários de simulação com as variáveis mais relevantes para o modelo. Cada cenário proposto foi treinado com o algoritmo de rede neural recorrente tensorflow. Os resultados de cada simulação foram analisados e comparados com os indicadores que medem a qualidade da previsão: erro absoluto médio (MAE), erro percentual absoluto médio (MAPE) e coeficiente de determinação (R2). O melhor MAPE obtido foi de 10,73% no cenário de consultas em pronto socorro utilizando dados meteorológicos. Os resultados apresentados mostraram que a utilização de dados meteorológicos melhora de 22% a 35% a previsão quando comparados com os cenários que não utilizam variáveis meteorológicas. A metodologia utilizada apresenta potencial de realizar previsão de demandas assistenciais e pode auxiliar as empresas do setor em ações direcionadas para tomada de decisão, sendo extensível a outros conjuntos de dados.

Abstract

The use of large data sets to help companies in decision making is in emphasis today. The scientific base in the analysis and exploration of data has inspired academic studies and generated interest of public and private companies. Data Science enters in this context as a focused and strategic study area for companies that wish to create a competitive advantage and generate new business. Some examples of technology advances in this area are: image and voice recognition, crime prevention, robotics, medical diagnostics and health care. The Private Health Insurance and Plans is an important activity to be explored in Data Science, with applications in the forecast of assistance demands and identification of frauds and abuses in medical bills. The risks of this activity require changes in the private health and plan business and the analytical study of the historical data generated by their agents are fundamental to these transformations. This dissertation presents the construction of a machine learning model that uses recurrent neural networks to make predictions of health care demands in private health plan operators. The methodology was applied to a dataset obtained from two sources: outpatient care data and meteorological data from the Maringá-PR region, which made it possible to compare the results of the forecast with and without the use of meteorological data. In the exploratory analysis stage the initial data were stratified resulting in new variables for the model construction. The data were normalized and the variables with high correlation were identified. From this, some simulation scenarios were created with the most relevant variables for the model. Each proposed scenario was trained with the recurrent neural network algorithm tensorflow. The results of each simulation were analyzed and compared with the indicators that measure the prediction quality: mean absolute error (MAE), mean absolute percentage error (MAPE) and coefficient of determination (R2). The best MAPE was 10.73% in the emergency medical scenario using meteorological data. The presented results showed that the use of meteorological data improves from 22% to 35% the forecast when compared to scenarios that not use meteorological variables. The methodology used has potential to forecast health care demands and can help companies in decision making, being extended to other data sets.

Data da defesa: 11/02/2019

Banca Examinadora

Orientador (a): Ana Paula Oening (Lactec)
Membro da Banca: Lúcio de Medeiros (Lactec)
Membro da Banca: Daniel Henrique Marco Detzel (Lactec)
Membro da Banca: Fabio Alessandro Guerra (GRAM)

Palavra(s)-Chave: Ciência de dados, Redes Neurais Recorrentes, Séries temporais, Demandas assistenciais, Saúde suplementar, Aprendizado de máquina.

Keywords: Data science, Recurrent Neural Networks, Time Series, Health Care Demands, Supplementary Health, Machine Learning.

 

Utilizamos cookies para oferecer melhor experiência, melhorar o desempenho, analisar como você interage em nosso site e personalizar conteúdo. Ao utilizar este site, você concorda com o uso de cookies.