A Machine Learning Approach for Prediction of Hospital Bed Availability
Autor/es:
Dalla Via Monti, Josefina
Tutor/es:
Vulcano, Gustavo
Schapchuck, Nicolás
Carrera de la tesis:
Master in Management+Analytics
Fecha:
2020Resumen
Las camas de internación constituyen un recurso escaso en las instituciones hospitalarias, los datos, en cambio, no. En el presente trabajo se argumenta que, haciendo uso de técnicas de aprendizaje automático, puede sacarse provecho del enorme volumen de data disponible en los sistemas de información de hospitales y sanatorios para construir soluciones de analytics que potencien la eficiente utilización de las camas de internación mediante la mejora del proceso de toma de decisiones. Con el objetivo de poner a prueba esta hipótesis, se trabajó en conjunto con una de las instituciones hospitalarias más importantes de la ciudad de Buenos Aires. El foco del trabajo estuvo puesto en la construcción de un modelo de aprendizaje automático que pudiera predecir la probabilidad de que un paciente sea dado de alta en las próximas veinticuatro horas, en función de su historia clínica, datos demográficos y algunos otros factorales ambientales. Para lograrlo se aplicaron técnicas de ingeniería de datos y aprendizaje supervisado, en el contexto de un problema de clasificación. Se experimentó con diferentes algoritmos así como formas de abordar la representación de atributos para sacar el máximo provecho de la data disponible. Como resultado, se obtuvo un modelo con un rendimiento prometedor que alcanza un puntaje de 0.84 de área bajo la curva ROC y ha demostrado generalizar muy bien en datos desconocidos. Dicho modelo fue la base sobre la cual se montó una herramienta de pronóstico de altas. Esta solución permite obtener tres predicciones, con diferentes niveles de incertidumbre asociada, de las altas esperadas en el Sanatorio para la fecha especificada. Los "niveles de confianza" reportados fueron obtenidos mediante un ejercicio de simulación sobre la data histórica que permitió comparar el pronóstico de la herramienta con el escenario observado en la realidad.
El equipo de gestión de operaciones del hospital en cuestión ha hecho explícito su interés en la solución propuesta, ya que evalúan que el modelo tiene un enorme potencial para facilitar el proceso de planificación de camas y, de esta manera, ayudar a mejorar la eficiencia operacional del sanatorio. Hospital beds are a scarce resource for healthcare facilities, data is not. In this thesis, we argue that machine learning techniques could take advantage of the abundant amount of data available at hospitals information systems inorder to build analytics solutions that could propel the efficiet utilization of beds by improving the management decission making process.
In order to test this hypothesis we have worked together with one of the most relevant medical institutions in Buenos Aires. The focus of our work has been placed in building a machine learning model that could predict the probability of a certain patient being discharged during the following twenty four hours, based on his medical records as well as his demographic data and some environmental factors. To this aim, data engineering and supervised learning techniques have been applied in the context of a classification task. We have experimented with different algorithms as well as feature representation approaches to make the most out of the data at hand.
As a result, a model with a promising performance of 0.84 AUC-ROC score was obtained, and its results have demonstrated to generalize quite well on unseen data. This model was the base on top of which a discharges forecaster tool was developed. This solution is able to return three different predictions of the hospital discharges for a specified date with different "confidence levels" associated, thus providing management with a risk-informed prediction of hospital beds availaibility. The "confidence" reported for each of the forecasts was obtained using a simulation approach for historic data where we were able to contrast the forecast output with the actual scenario.
The hospital management team has made explicit its interest in the solution, as they assess it has an enourmous potential for facilitating the bed planning process and by doing so improving the hospital operational efficiency.