Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría

Loading...
Thumbnail Image

Date

relationships.isAdvisorOf

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

El objetivo del siguiente trabajo es la elaboración de un modelo de Procesamiento de Lenguaje Natural (NLP) para clasificar los mensajes con consultas que envían los usuarios de Properati. Recurrimos a la metodología Bag of Words, utilizando un XGBoost como modelo para hacer las predicciones. Presentamos distintas técnicas de preprocesamiento de texto como tokenización, eliminación de stopwords, lematización, umbrales de frecuencia mínima para tokens y normalización TF-IDF. Hacemos pruebas sobre dos categorías para seleccionar las transformaciones que se efectúen al modelo. El modelo arroja, finalmente, una buena performance en las etiquetas de mayor frecuencia.

Description

Keywords

Análisis de datos, Predicción tecnológica

Citation

Citation

Endorsement

Review

Supplemented By

Referenced By