Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría
Metadatos:
Mostrar el registro completo del ítemAutor/es:
Cisco, Santiago
Tutor/es:
Gravano, Agustín
Carrera de la tesis:
Master in Management + Analytics
Fecha:
2021Resumen
El objetivo del siguiente trabajo es la elaboración de un modelo de Procesamiento de Lenguaje Natural (NLP) para clasificar los mensajes con consultas que envían los usuarios de Properati. Recurrimos a la metodología Bag of Words, utilizando un XGBoost como modelo para hacer las predicciones. Presentamos distintas técnicas de preprocesamiento de texto como tokenización, eliminación de stopwords, lematización, umbrales de frecuencia mínima para tokens y normalización TF-IDF. Hacemos pruebas sobre dos categorías para seleccionar las transformaciones que se efectúen al modelo. El modelo arroja, finalmente, una buena performance en las etiquetas de mayor frecuencia.