Show simple item record

dc.rights.licensehttps://creativecommons.org/licenses/by-sa/2.5/ar/es_AR
dc.contributor.advisorVulcano, Gustavoes_AR
dc.contributor.advisorSchapchuck, Nicoláses_AR
dc.contributor.authorDalla Via Monti, Josefinaes_AR
dc.coverage.spatialRepública Argentinaes_AR
dc.coverage.spatialCiudad Autónoma de Buenos Aireses_AR
dc.date.accessioned2022-07-14T17:38:01Z
dc.date.available2022-07-14T17:38:01Z
dc.date.issued2020
dc.identifier.urihttps://repositorio.utdt.edu/handle/20.500.13098/11239
dc.description.abstractLas camas de internación constituyen un recurso escaso en las instituciones hospitalarias, los datos, en cambio, no. En el presente trabajo se argumenta que, haciendo uso de técnicas de aprendizaje automático, puede sacarse provecho del enorme volumen de data disponible en los sistemas de información de hospitales y sanatorios para construir soluciones de analytics que potencien la eficiente utilización de las camas de internación mediante la mejora del proceso de toma de decisiones. Con el objetivo de poner a prueba esta hipótesis, se trabajó en conjunto con una de las instituciones hospitalarias más importantes de la ciudad de Buenos Aires. El foco del trabajo estuvo puesto en la construcción de un modelo de aprendizaje automático que pudiera predecir la probabilidad de que un paciente sea dado de alta en las próximas veinticuatro horas, en función de su historia clínica, datos demográficos y algunos otros factorales ambientales. Para lograrlo se aplicaron técnicas de ingeniería de datos y aprendizaje supervisado, en el contexto de un problema de clasificación. Se experimentó con diferentes algoritmos así como formas de abordar la representación de atributos para sacar el máximo provecho de la data disponible. Como resultado, se obtuvo un modelo con un rendimiento prometedor que alcanza un puntaje de 0.84 de área bajo la curva ROC y ha demostrado generalizar muy bien en datos desconocidos. Dicho modelo fue la base sobre la cual se montó una herramienta de pronóstico de altas. Esta solución permite obtener tres predicciones, con diferentes niveles de incertidumbre asociada, de las altas esperadas en el Sanatorio para la fecha especificada. Los "niveles de confianza" reportados fueron obtenidos mediante un ejercicio de simulación sobre la data histórica que permitió comparar el pronóstico de la herramienta con el escenario observado en la realidad. El equipo de gestión de operaciones del hospital en cuestión ha hecho explícito su interés en la solución propuesta, ya que evalúan que el modelo tiene un enorme potencial para facilitar el proceso de planificación de camas y, de esta manera, ayudar a mejorar la eficiencia operacional del sanatorio.es_AR
dc.description.abstractHospital beds are a scarce resource for healthcare facilities, data is not. In this thesis, we argue that machine learning techniques could take advantage of the abundant amount of data available at hospitals information systems inorder to build analytics solutions that could propel the efficiet utilization of beds by improving the management decission making process. In order to test this hypothesis we have worked together with one of the most relevant medical institutions in Buenos Aires. The focus of our work has been placed in building a machine learning model that could predict the probability of a certain patient being discharged during the following twenty four hours, based on his medical records as well as his demographic data and some environmental factors. To this aim, data engineering and supervised learning techniques have been applied in the context of a classification task. We have experimented with different algorithms as well as feature representation approaches to make the most out of the data at hand. As a result, a model with a promising performance of 0.84 AUC-ROC score was obtained, and its results have demonstrated to generalize quite well on unseen data. This model was the base on top of which a discharges forecaster tool was developed. This solution is able to return three different predictions of the hospital discharges for a specified date with different "confidence levels" associated, thus providing management with a risk-informed prediction of hospital beds availaibility. The "confidence" reported for each of the forecasts was obtained using a simulation approach for historic data where we were able to contrast the forecast output with the actual scenario. The hospital management team has made explicit its interest in the solution, as they assess it has an enourmous potential for facilitating the bed planning process and by doing so improving the hospital operational efficiency.es_AR
dc.format.extentVII p.es_AR
dc.format.extent98 p.es_AR
dc.format.mediumapplication/pdfes_AR
dc.languageenges_AR
dc.rightsinfo:eu-repo/semantics/openAccesses_AR
dc.subjectAnálisis de datoses_AR
dc.subjectConstrucción de algoritmoses_AR
dc.subjectModelos causaleses_AR
dc.subjectAdministración Hospitalariaes_AR
dc.subjectInstituciones de Saludes_AR
dc.subjectHospitaleses_AR
dc.subjectMachine learninges_AR
dc.subjectData Mininges_AR
dc.subjectData Analyticses_AR
dc.subjectHealth Resourceses_AR
dc.subjectAlgorithmic Mechanism Designes_AR
dc.subjectClinical Decision Support Systemses_AR
dc.titleA Machine Learning Approach for Prediction of Hospital Bed Availabilityes_AR
dc.typeinfo:eu-repo/semantics/articlees_AR
dcterms.description.tableOfContentsAbstract v Dedication vii Contents ix 1 Introduction (1) 1.1 Background (1) 1.1.1 Hospital Bed Management(1) 1.1.2 Machine Learning (2) 1.2 Justification (3) 1.3 Objective (3) 2 Methods & Procedures (5) 2.1 CRISP-DM Methodology (5) 2.2 Data (8) 2.2.1 Exploration (9) 2.2.2 ETL (18) 2.3 Machine Learning Techniques (23) 2.3.1 Supervised Learning Algorithms (23) 2.3.2 Machine Learning Model Evaluation (28) 2.3.3 Feature Engineering Techniques (33) 2.4 Software (35) 3 Results (37) 3.1 Model Experiments (37) 3.2 Model Selection (41) 3.3 Final Model Assessment (50) 4 Discussion (53) 5 Conclussions and Recommendations (57) 5.1 Project Achievements (57) 5.2 Limitations (58) 5.3 Management Recommendations (60) A List of variables in each dataset (65) B Data Quality Reports (73) C Data Quality Plan (81) D Feature importance plots for different model experiments (87) E Simulation results (91) F Forecaster output example (93) Bibliography (95)es_AR
thesis.degree.nameMaster in Management+Analyticsen
thesis.degree.level1
thesis.degree.grantorUniversidad Torcuato Di Tella. Escuela de Negocioses_AR
dc.type.versioninfo:eu-repo/semantics/acceptedVersiones_AR


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record