Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría

Cisco, Santiago

Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría

Files

MiM_Cisco_2021.pdf (1.27 MB)

Date

2021

Authors

Cisco, Santiago

relationships.isAdvisorOf

Gravano, Agustín

Abstract

El objetivo del siguiente trabajo es la elaboración de un modelo de Procesamiento de Lenguaje Natural (NLP) para clasificar los mensajes con consultas que envían los usuarios de Properati. Recurrimos a la metodología Bag of Words, utilizando un XGBoost como modelo para hacer las predicciones. Presentamos distintas técnicas de preprocesamiento de texto como tokenización, eliminación de stopwords, lematización, umbrales de frecuencia mínima para tokens y normalización TF-IDF. Hacemos pruebas sobre dos categorías para seleccionar las transformaciones que se efectúen al modelo. El modelo arroja, finalmente, una buena performance en las etiquetas de mayor frecuencia.

Keywords

Análisis de datos, Predicción tecnológica

URI

https://repositorio.utdt.edu/handle/20.500.13098/11568

Collections

Master in Management + Analytics

Full item page

Clasificación de mensajes dentro de la plataforma Properati: Un abordaje con NLP Maestría

Files

Date

Authors

relationships.isAdvisorOf

Journal Title

Journal ISSN

Volume Title

Publisher

Abstract

Description

Keywords

Citation

Citation

URI

Collections

Endorsement

Review

Supplemented By

Referenced By