Entorno para la inteligencia de negocio basada en tecnologías semánticas

Author

Esteban Gil, Ángel

Director

Fernández Breis, Jesualdo Tomás

García Sánchez, Francisco

Date of defense

2015-12-22

Pages

295 p.



Department/Institute

Universidad de Murcia. Departamento de Informática y Sistemas

Abstract

Objetivos: La Inteligencia de Negocio (IN) requiere de la integración de diversas fuentes de datos que se suelen encontrar en las organizaciones y en sus entornos. El conocimiento generado por estas organizaciones se encuentra distribuido en sistemas heterogéneos o está en formatos en los que es prácticamente imposible su clasificación (imágenes, vídeos, etc.). En esta tesis se proponen metodologías y herramientas para generar una solución de Inteligencia de Negocio basada en tecnologías semánticas que permita integrar cualquier fuente de datos. Además aportará grandes ventajas en el ámbito de la IN 2.0, ya que integra información de redes sociales. Por último, y como principales novedades, la solución propuesta será capaz de generar cuestionarios semánticos que aporten nuevo conocimiento e integrará una herramienta para medir y evaluar los activos de conocimiento. Entre los servicios de generación de conocimiento que ofrece esta solución destacan: (1) evaluar los activos de conocimiento de cualquier organización, (2) realizar análisis personalizados de cada una de las actividades, (3) recomendar las medidas que se deben llevar a cabo, y (4) analizar el impacto que esas medidas han tenido en la organización a nivel cuantitativo y cualitativo. Metodología: Para conseguir este objetivo, primero se lleva a cabo un estudio del estado del arte que incluye las tecnologías de IN existentes en el mercado, las tecnologías de la Web Semántica y su aplicación en este dominio, la Web 2.0, los sistemas de integración de datos, el procesamiento analítico en línea (OLAP) y los métodos de evaluación de activos de conocimiento. La solución propuesta se basa en la definición de: (1) un modelo de integración semántica de cualquier tipo de contenido, estructurado y no estructurado, (2) un modelo de entrega de información basado en tecnologías semánticas, (3) un modelo de evaluación de activos de conocimiento, y (4) un modelo de explotación y análisis de la información. Estos modelos serán integrados en una plataforma Web que permita integrar, analizar y explotar los datos de cualquier tipo de información. Los resultados obtenidos serán validados en los siguientes dominios: económico-financiero, evaluación del desempeño, clínico y de apoyo a la investigación biomédica. Resultados: Las principales contribuciones son: (a) diseño de un modelo de evaluación de activos de conocimiento basado en tecnologías semánticas, (b) diseño de un modelo de generación de perfiles semánticos de recursos, (c) diseño e implementación de un generador gráfico de consultas SPARQL, (d) diseño de un modelo para la generación de cuestionarios semánticos, (e) diseño de un modelo para la recomendación basado en funciones de similitud, (f) diseño de un modelo para la recomendación basado en redes bayesianas, (g) cuadros de mando semánticos, y (h) puesta en producción de tres soluciones semánticas que están operativas actualmente. Gracias a estos módulos se han desarrollado y validado cinco soluciones completamente operativas: (1) red social semántica, (2) plataforma semántica para la planificación, (3) plataforma semántica para Inteligencia de Negocio con bases de datos epidemiológicas, (4) cuaderno de recogida de datos semánticos y (5) plataforma para la clasificación semántica de recursos basada en contenidos multimedia. Conclusiones: En este trabajo se han definido una serie de metodologías e implementado un conjunto de herramientas que permiten integrar, entregar información y analizar los datos usando tecnologías semánticas. Esas tecnologías permiten que los usuarios, sin ayuda de personal experto en TIC, puedan configurar buscadores avanzados, generar cuadros de mando personalizados, realizar planes estratégicos y evaluar su impacto, y establecer análisis complejos a partir de perfiles semánticos. Además, gracias al uso de tecnologías semánticas se han sentado las bases para que se pueda enlazar con fuentes de datos externas y realizar análisis comparativos con otras organizaciones.


Objectives: BI requires the integration of several data sources. In many cases, data are distributed among heterogeneous systems or in formats where the classification of images or videos is nearly impossible. Furthermore, the lack of formal models for exploiting organisations is a problem with personalised analyses, and when linking to external resources or comparing companies is required. This thesis proposes methodologies and technologies for building BI solutions using semantic technologies that meet the essential requirements for this type of platforms. In the scope of BI 2.0, this proposal also integrates information from social networks. The solution proposed is able to generate semantic questionnaires that add new knowledge and integrate a methodology for measuring and evaluating the knowledge. The following services should be pointed out: (1) to perform personalised analysis of every company's activities, (2) to evaluate the knowledge in any organisation, (3) to recommend the actions to be carried out and (4) to analyse the impact of these actions in the organisation. Methodology: The first step followed in this thesis consists in the analysis of the state of art of Business Intelligence, Semantic Web, Web 2.0, information integration, On-Line Analytical Processing (OLAP) and evaluation of knowledge assets. The definition of the approach includes: (a) a study of the integration model for building a semantic repository, (b) development of an integration process for adding new semantic information, (c) development of a graphical tool for defining SPARQL queries, (d) development of a generic model for evaluation of knowledge assets, (e) development of a method for defining reduced representations of data for efficient analysis, and (f) the study and selection of solutions for exploiting the information generated in previous phases. All these proposed solutions are implemented in a web platform. The semantic BI platform has been validated in several domains, like financial, performance evaluation, and biomedical research. Results: The main contributions of this work are: (a) design of an evaluation model based on semantic knowledge technologies, (b) design of a semantic model for generating resource profiles, (c) design and implementation of a SPARQL queries generator driven by ontologies, (d) design of a model for the generation of semantic reports, (e) design of a model for the recommendation based on similarity functions, (f) design of a model for the recommendation based on Bayesian networks, (g) customisable semantic dashboards and (h) three out of the six evaluation use cases are running in real environments. These approaches have been successfully implemented and validated in five solutions: (1) semantic social networks, (2) semantic platform for strategic planning, (3) semantic platform for epidemiological analysis, (4) semantic case report form, and (5) semantic platform for multimedia content analysis. Conclusions: In this thesis we have defined a set of methodologies and implemented a set of tools to integrate, deliver information and analyse data using semantic technologies. These technologies allow users, without the help of ICT experts, to configure advanced search engines, build custom dashboards, make strategic plans, evaluate their impact, and do complex analyses from semantic profiles. Furthermore, thanks to the use of semantic technologies, we have established the bases to link to external data sources and comparative analysis with other organisations.

Keywords

Semántica-Informática

Subjects

004 - Computer science and technology. Computing. Data processing

Knowledge Area

Ingeniería

Documents

TAEG.pdf

5.692Mb

 

Rights

ADVERTENCIA. El acceso a los contenidos de esta tesis doctoral y su utilización debe respetar los derechos de la persona autora. Puede ser utilizada para consulta o estudio personal, así como en actividades o materiales de investigación y docencia en los términos establecidos en el art. 32 del Texto Refundido de la Ley de Propiedad Intelectual (RDL 1/1996). Para otros usos se requiere la autorización previa y expresa de la persona autora. En cualquier caso, en la utilización de sus contenidos se deberá indicar de forma clara el nombre y apellidos de la persona autora y el título de la tesis doctoral. No se autoriza su reproducción u otras formas de explotación efectuadas con fines lucrativos ni su comunicación pública desde un sitio ajeno al servicio TDR. Tampoco se autoriza la presentación de su contenido en una ventana o marco ajeno a TDR (framing). Esta reserva de derechos afecta tanto al contenido de la tesis como a sus resúmenes e índices.

This item appears in the following Collection(s)