Recommender sytem based on NLP: a support tool for the publishing sector

Author

Martín Sujo, Jessie Caridad

Director

Golobardes Ribé, Elisabet

Date of defense

2023-07-26

Pages

176 p.



Department/Institute

Universitat Ramon Llull. La Salle

Abstract

En els darrers anys, la indústria editorial espanyola s'ha anat acostant cada cop més a la transformació digital, però encara queden molts reptes per superar, especialment en les recomanacions al client final (lectors). Amb l'avenç de l'aprenentatge automàtic, una branca de la intel·ligència artificial, és possible que es puguin complir molts reptes. Tot i això, és important assenyalar que els llibres hauran de ser recomanats per un gènere literari de forma individual, ja que presenten característiques completament diferents entre si. Per a l'anàlisi dels llibres de No ficció, aquest treball es basarà en les vendes històriques i la influència de l'autor a les xarxes socials. Per això, a nivell darquitectura, es definirà com un model potenciador, que reduirà els errors en lanàlisi predictiva de dades. I per a l'anàlisi dels llibres de ficció, es partirà de les emocions que transmet el text. És per això que, a nivell d'arquitectura, estarà determinada per les xarxes de Transformadors, la responsabilitat dels quals serà manipular dades seqüencials, principalment al camp de la PNL. Finalment, ia nivell de disseny, les sortides d?aquests subsistemes serviran com a dades d?entrada per al motor de recomanacions. En aquesta tesi es proposa un sistema de recomanació final basat en el Processament del Llenguatge Natural (PNL), les principals contribucions del qual són: (1) la integració de professions multidisciplinàries com la psicologia, la literatura i la intel·ligència artificial; (2) un disseny d'un sistema intel·ligent que recomana basant-se en el comportament del lector i no només en les compres; i (3) impulsar la qualitat literària sense deixar d'atreure persones que no solen llegir.


En los últimos años, la industria editorial española se ha ido acercando cada vez más a la transformación digital, sin embargo aún quedan muchos retos por superar, especialmente en las recomendaciones al cliente final (lectores). Con el avance del aprendizaje automático, una rama de la inteligencia artificial, es posible que se puedan cumplir muchos de estos desafíos. Sin embargo, es importante señalar que los libros tendrán que ser recomendados por un género literario de forma individual, ya que presentan características completamente diferentes entre sí. Para el análisis de los libros de No ficción, este trabajo se basará en las ventas históricas y la influencia del autor en las redes sociales. Por eso, a nivel de arquitectura, se definirá como un modelo potenciador, que reducirá los errores en el análisis predictivo de datos. Y para el análisis de los libros de Ficción, se partirá de las emociones que transmite el texto. Es por ello que, a nivel de arquitectura, estará determinada por las redes de Transformadores, cuya responsabilidad será manipular datos secuenciales, principalmente en el campo de la PNL. Finalmente, y a nivel de diseño, las salidas de estos subsistemas servirán como datos de entrada para el motor de recomendaciones. En esta tesis se propone un sistema de recomendación final basado en el Procesamiento del Lenguaje Natural (PNL), cuyas principales contribuciones son: (1) la integración de profesiones multidisciplinares como la psicología, la literatura y la inteligencia artificial; (2) un diseño de un sistema inteligente que recomiende con base en el comportamiento del lector y no solo en sus compras; y (3) impulsar la calidad literaria sin dejar de atraer a personas que no suelen leer.


In recent years, the Spanish publishing industry has been getting closer and closer to digital transformation, however there are still many challenges to overcome, especially in recommendations to the end customer (readers). With the advancement of Machine learning, a branch of Artificial Intelligence, it is possible that many of these challenges can be met. However, it is important to note that the books will have to be recommended by a literary genre individually, since they present completely different characteristics from each other. For the analysis of Non-fiction books, this work will be based on historical sales and the author's influence on social networks. That is why, at the architecture level, it will be defined as a boosting model, which will reduce errors in predictive data analysis. And for the analysis of Fiction books, it will be based on the emotions that the text transmits. That is why, at the architecture level, it will be determined by Transformers networks, whose responsibility will be to manipulate sequential data, mainly in the field of NLP. Finally, and at the design level, the outputs of these subsystems will serve as input data for the recommendation engine. In this thesis, a final recommendation system based on Natural Language Processing (NLP) is proposed, whose main contributions are: (1) the integration of multidisciplinary professions such as psychology, literature and artificial intelligence; (2) a design of an intelligent system that recommends based on the behavior of the reader and not only on their purchases; and (3) boost literary quality while still attracting people who don't usually read.

Keywords

Inteligencia Artificial; Transformers; Industria Editorial; Machine learning; Motor de recomendación; Procesamiento de lenguaje natural; Sistema Inteligente

Subjects

004 - Computer science and technology. Computing. Data processing; 311 - Statistics as a science. Statistical theory; 6 - Applied Sciences. Medicine. Technology; 62 - Engineering. Technology in general

Knowledge Area

Tecnologies de la informació i de les comunicacions (TIC)

Documents

Tesi_JessieCaridad_Martin.pdf

15.60Mb

 

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)