Efficient sequential and temporal pattern mining

Author

Mordvanyuk, Natalia

Director

López, Beatriz (López Ibáñez)

Bifet, Albert

Date of defense

2021-10-13

Pages

139 p.



Department/Institute

Universitat de Girona. Departament d'Enginyeria Elèctrica, Electrònica i Automàtica

Doctorate programs

Programa de Doctorat en Tecnologia

Abstract

The contributions of the present thesis are in the domain of Pattern Mining and Knowledge Discovery, being of particular relevance for the sequential pattern mining and time-interval related pattern mining fields. In this thesis, a new efficient sequential pattern mining algorithm called VEPRECO is introduced, the contributions of which are: (i) a new representation, (ii) pre-pruning strategies and (iii) candidate selection policies which reduce the number of iterations of the algorithm. In this thesis, a new efficient algorithm for mining time interval patterns, called vertTIRP, has also been presented, combining an efficient representation of these patterns with a pairing strategy to accelerate the mining process. And finally, to open the door of mining of time interval patterns to multivariate time series, the TA4L algorithm has been introduced. TA4L transforms time series into interval-based sequences suitable for feeding time interval algorithms


Les contribucions d'aquesta tesi estan en el domini de la mineria de patrons i el descobriment del coneixement, sent de particular rellevància pels camps de mineria de patrons seqüencials i els patrons d'intervals temporals. En aquesta tesi, s'ha presentat un nou algoritme eficient de mineria de patrons seqüencials anomenat VEPRECO, les contribucions del qual són: (i) una nova representació, (ii) unes estratègies de prepoda i (iii) unes polítiques de selecció de candidats que redueixen el nombre d'iteracions de l'algoritme. En aquesta tesi, també s'ha presentat un nou algoritme eficient per minar patrons d'intervals temporals, denominat vertTIRP, el qual combina una representació eficient d'aquests patrons amb una estratègia d'aparellament per tal d’accelerar el procés de la mineria. I finalment, per obrir la porta de la mineria de patrons d'intervals temporals a sèries temporals multivariades, s'ha presentat l'algoritme TA4L. TA4L transforma sèries temporals en seqüències d’intèrvals aptes per alimentar algoritmes d'intervals temporals

Keywords

Patrons d'intervals temporals; Patrones de intervalos temporales; Time interval related patterns; Mineria de patrons seqüencials; Minería de patrones secuenciales; Sequential pattern mining; Relacions temporals; Relaciones temporales; Temporal relations; Mineria de dades temporals; Minería de datos temporales; Temporal data mining; Seqüències d'intervals temporals; Secuencias de intervalos temporales; Time interval sequences; Abstracció temporal; Abstracción temporal; Temporal abstraction

Subjects

004 - Computer science; 68 - Industries, crafts and trades for finished or assembled articles

Documents

tnm_20211013.pdf

6.255Mb

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)