

Date
2011
Journal Title
Journal ISSN
Volume Title
Autor
Montecinos Valenzuela, Claudio Alfonso
Profesor Guía
Profesor Tutor
Profesor
Profesor Informante
Autor Institucional
Jefe de Proyecto
Profesor Co-Tutor
Profesor Patrocinante
Profesor Tutor
Publisher
Universidad de Talca (Chile). Facultad de Ingeniería
Compartir este registro
Clasificación binaria mediante ensembles para clases desbalanceadas: una aplicación al problema de predicción de fuga de clientes
Abstract
En el presente trabajo de Tesis se propone una metodología para la construcción de un modelo de clasificación binaria en el contexto de desbalance y traslape de clases, con el objetivo de generar un modelo con un mayor poder predictivo. El modelo está basado en la combinación de métodos de
dos enfoques de clasificación: el enfoque discriminante y el basado en reconocimiento o clasificación de una clase. A través de esta estrategia se espera inducir clasificadores individuales capaces de
rescatar de mejor manera diversas regiones del espacio de datos y de esta manera combinar sus decisiones en un ensemble de métodos. Al respecto, dos estrategias de combinación de decisiones son utilizadas: reglas fijas de combinación y el método Stacking. La aplicación de la metodología
sobre bases de datos artificiales muestra la capacidad de los ensembles para incrementar el rendimiento de clasificación. Al respecto, los beneficios generados son mayores en aquellas bases de datos más complejas, en las cuales los métodos individuales no generan resultados satisfactorios, pero tienden a ser más diversos. Además, la metodología es aplicada a un problema real de predicción de fugas de clientes. En este contexto, se confirma la capacidad de los ensembles para generar predicciones más asertivas, logrando un 5.4% de incremento por sobre el máximo alcanzado
por un clasificador individual, considerando como medida de rendimiento la media geométrica de las tasas de acierto individuales sobre cada clase. Se destaca que este beneficio es originado
principalmente por un incremento en la tasa de acierto sobre la clase “Fuga” (minoritaria). Los resultados obtenidos en la etapa de experimentación, así como en la aplicación real, sugieren que el método Stacking es el más adecuado para la combinación de clasificadores cuando es inducido un meta-clasificador robusto como SVM con función de kernel RBF
Description
147 p.