Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría
View/ Open
Metadata
Show full item recordAuthor/s:
Cisco, Santiago
Advisor/s:
Gravano, Agustín
Thesis degree name:
Master in Management + Analytics
Date:
2021Abstract
El objetivo del siguiente trabajo es la elaboración de un modelo de Procesamiento de Lenguaje Natural (NLP) para clasificar los mensajes con consultas que envían los usuarios de Properati. Recurrimos a la metodología Bag of Words, utilizando un XGBoost como modelo para hacer las predicciones. Presentamos distintas técnicas de preprocesamiento de texto como tokenización, eliminación de stopwords, lematización, umbrales de frecuencia mínima para tokens y normalización TF-IDF. Hacemos pruebas sobre dos categorías para seleccionar las transformaciones que se efectúen al modelo. El modelo arroja, finalmente, una buena performance en las etiquetas de mayor frecuencia.