Show simple item record

dc.rights.licensehttps://creativecommons.org/licenses/by-sa/2.5/ar/es_AR
dc.contributor.advisorGonzález Rozada, Martín
dc.contributor.authorUsuga, Ivánes_AR
dc.date.accessioned2023-12-06T16:18:24Z
dc.date.available2023-12-06T16:18:24Z
dc.date.issued2023
dc.identifier.urihttps://repositorio.utdt.edu/handle/20.500.13098/12186
dc.description.abstractLa ciencia de datos es un conocimiento que entendemos tan bien que podemos enseñarlo a una computadora. Todo lo demás es arte" (Rosana, 2023). Mientras existan códigos que recreen un evento o datos que simulen el comportamiento de una situación, las computadoras estarán prestas aprender. El objetivo de este ensayo es generar ciertos procedimientos a tener en cuenta en la base de datos después de haber sido recolectada, de tal modo que los datos queden a punto para realizar análisis predictivos ya sea usando técnicas estadísticas convencionales o de aprendizaje automático. Ya que los datos son el elemento principal tanto para el análisis predictivo o la toma de decisiones es fundamental darle un manejo adecuado a la recopilación de datos relevantes, a la identificación de los datos faltantes o erróneos y a la transformación de los mismos en un formato adecuado para el procesamiento de los mismos, ya sea usando técnicas como regresiones lineales o modelos de aprendizaje automático. La ruta de trabajo a seguir consta de dos secciones. La primera parte correspondiente al manejo de los datos para verificar anomalías que se presentan durante el proceso de recopilación de la información, las cuales necesitan ser corregidas para darles un formato correcto y así dejarlas funcionales para usos posteriores. El dataset a usar para este fin se cargará desde el repositorio de la Universidad de California correspondiente al Censo de los Estados Unidos 2016 para constatar quienes de los encuestados no tienen seguro de salud.es_AR
dc.format.extent45 p.es_AR
dc.format.mediumapplication/pdfes_AR
dc.languagespaes_AR
dc.publisherUniversidad Torcuato Di Tellaes_AR
dc.rightsinfo:eu-repo/semantics/openAccesses_AR
dc.subjectDatoses_AR
dc.subjectData Analysises_AR
dc.titlePreparación de Datos para Aprendizaje Automáticoes_AR
dc.typeinfo:eu-repo/semantics/masterThesises_AR
dc.typeinfo:ar-repo/semantics/tesis de maestríaes_AR
thesis.degree.nameMaestría en Econometríaes_Ar
dc.subject.keywordAprendizaje automáticoes_AR
dc.subject.keywordMachine Learninges_AR
dc.subject.keywordProcesamiento de datoses_AR
dc.subject.keywordSkimres_AR
dc.subject.keywordwvplotses_AR
dc.subject.keywordhexbines_AR
dc.subject.keywordvtreates_AR
dc.subject.keywordDataexploreres_AR
dc.subject.keywordscaleses_AR
dc.subject.keywordtraining_setes_AR
dc.subject.keywordtest_setes_AR
dc.subject.keywordglmes_AR
dc.subject.keywordknnes_AR
dc.subject.keywordRandom Forestes_AR
dc.subject.keywordxgboostes_AR
dc.subject.keywordroces_AR
dc.subject.keywordauces_AR
dc.type.versioninfo:eu-repo/semantics/acceptedVersiones_AR


Files in this item

Thumbnail

This item appears in the following Collection(s)

Show simple item record