Obtención de reglas de clasificación difusas utilizando técnicas de optimización - caso de estudio riesgo crediticio

Author

Jimbo Santana, Patricia Rosalia

Director

Fernández Bariviera, Aurelio

lanzarini, Laura

Date of defense

2020-07-14

Pages

166 p.



Department/Institute

Universitat Rovira i Virgili. Departament de Gestió d'Empreses

Abstract

L'aportació central d'aquesta tesi és la definició d'un nou mètode denominat FRvarPSO (Fuzzy Rules variable Particle Swarm Oprmization) que genera un conjunt de regles de classificació difuses de fàcil interpretació, baixa cardinalitat i una bona precisió. Aquestes característiques ajuden a identificar i comprendre les relacions presents en les dades facilitant i justificant d'aquesta forma la presa de decisions. FRvarPSO combina una xarxa neuronal competitiva, amb una tècnica d'optimització basada en cúmul de partícules de població variable per a l'obtenció de regles de classificació difuses, capaces d'operar sobre atributs nominals i numèrics. Els antecedents de les regles estan formats per atributs nominals i/o condicions difuses. La conformació d'aquestes últimes requereix conèixer el grau de pertinença als conjunts difusos que defineixen a cada variable lingüística. Aquesta tesi proposa tres alternatives diferents per a l'obtenció dels conjunts difusos, i la seva funció de pertinença. Una d'aquestes opcions va ser particionar el rang de cada atribut numèric en intervals d'igual longitud, i centrant en cadascun d'ells una funció triangular amb una superposició adequada. Una altra de les formes per a obtenir els conjunts difusos ha estat utilitzant el mètode Fuzzy C-Means. Addicionalment, es va utilitzar també com a tècnica el coneixement d'un expert. FRvarPSO s'aplica a diferents bases de dades del repositori UCI i a un cas particular d'estudi són les regles aplicables a risc creditici. Per aquest últim cas s'utilitza la informació del prestatari i l'entorn macroeconòmic, obtinguda de bases de dades reals d'institucions financeres de l'Equador. Aquest mètode aporta coneixement a l'àrea informàtica i s'ha demostrat que també realitza aportacions en l'àrea de l'economia.


El aporte central de esta tesis es la definición de un nuevo método denominado FRvarPSO (Fuzzy Rules variable Particle Swarm Oprmization) que genera un conjunto de reglas de clasificación difusas de fácil interpretación, baja cardinalidad y una buena precisión. Estas características ayudan a identificar y comprender las relaciones presentes en los datos facilitando y justificando de esta forma la toma de decisiones. FRvarPSO combina una red neuronal competitiva, con una técnica de optimización basada en cúmulo de partículas de población variable para la obtención de reglas de clasificación difusas, capaces de operar sobre atributos nominales y numéricos. Los antecedentes de las reglas están formados por atributos nominales y/o condiciones difusas. La conformación de estas últimas requiere conocer el grado de pertenencia a los conjuntos difusos que definen a cada variable lingüística. Esta tesis propone tres alternativas distintas para la obtención de los conjuntos difusos, y su función de pertenencia. Una de estas opciones fue particionar el rango de cada atributo numérico en intervalos de igual longitud, y centrando en cada uno de ellos una función triangular con un solapamiento adecuado. Otra de las formas para obtener los conjuntos difusos ha sido utilizando el método Fuzzy C-Means. Adicionalmente, se utilizó también como técnica el conocimiento de un experto. FRvarPSO se aplica, a distintas bases de datos del respositorio UCI, y a un caso particular de estudio de riesgo crediticio. En este último caso se utiliza la información del prestatario y el entorno macroeconómico, obtenida de bases de datos reales de instituciones financieras del Ecuador. Este método aporta conocimiento al área informática, y se ha demostrado que también realiza aportes en el área de la economía.


The central contribution of this thesis is the definition of a new method designated as FRvarPSO (Fuzzy Rules variable Particle Swarm Oprmization) that generates a pool of fuzzy classification rules of easy to understand, low cardinality and good accuracy. These characteristics aid at identifying the relationships in data facilitating and justifying the decision making process. FRvarPSO combines a competitive neuronal network, with an optimization technique based on clusters of particles with variable population for the obtention of fuzzy classification rules, able to operate on nominal and numeric attributes. The antecedents of the rules are formed by nominal attributes and/or fuzzy conditions. The formation of conditions requires to know the membership degree of the linguistic variable to the different fuzzy subsets. This thesis proposes three distinct alternatives for the obtention of the fuzzy subsets, and their membership function. One of these options was partitioning the rank of each numeric attribute at intervals of equal length, and centering each of them in a triangular function with a suitable overlapping. Another of the forms to obtain the fuzzy subsets has been utilising Fuzzy C-Means method. Additionally, we used also as a technique based on the knowledge of an expert. FRvarPSO is applied to different databases of the UCI repository and to a particular case of study of credit scoring. In this last case, we information of borrowers and macroeconomic contextual information, obtained from real databases of financial institutions of the Ecuador. This method contributes ken at the computer area and has evidenced that also realises contributions at the area of the economics.

Keywords

Mineria de dades; Regles de classificació difuse; FRvarPSO; Minería de datos; Reglas de clasificación difusa; Data mining; Fuzzy classification rules

Subjects

004 - Computer science; 33 - Economics

Knowledge Area

Enginyeria i arquitectura

Documents

TESI PATRICIA_JIMBO_SANTANA.pdf

2.977Mb

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)