dc.contributor
Universitat Pompeu Fabra. Departament de Ciències Experimentals i de la Salut
dc.contributor.author
Nonell Mazelon, Lara
dc.date.accessioned
2019-12-02T17:16:49Z
dc.date.available
2020-11-19T00:00:57Z
dc.date.issued
2019-11-19
dc.identifier.uri
http://hdl.handle.net/10803/668053
dc.description.abstract
The breakthrough in the technological field has allowed the extraction of large
amounts of the so-called omics data. The analysis and Integration of this type of
data by means of advanced statistical and bioinformatics methods will allow the
improvement in the management of diseases. The diversity and complexity of
omics data has encouraged the development of hundreds of new statistical
methods to meet this objective. Therefore, having the appropriate methods to
accommodate different data distributions and modelling complex data structures
becomes essential. This thesis presents advances in three directions in this
regard. First, the study of several methods to assess non-linear associations
which is relevant when assessing the effect of environmental exposures (i.e
exposome) on complex diseases. The study is accompanied by the
development of the R package nlOmicAssoc. Second, the simplex distribution is
proposed to analyse methylome data since this distribution properly fits beta
values that are generated in this type of studies. The extension to generalized
linear models with simplex response is also proposed. Lastly, an R package,
HOmics, has been developed to incorporate a priori biological knowledge into
association studies by using Bayesian hierarchical models. It also implements
methods to model the dependence between omics data, enabling data
integration
dc.description.abstract
L’avenç en el camp tecnològic ens ha permès obtenir grans quantitats de les
anomenades dades òmiques. L’anàlisi i integració d’aquesta mena de dades
mitjançant mètodes estadístics i bioinformàtics avançats ha de permetre la
millora en el maneig de les malalties. La diversitat i complexitat de les dades
òmiques ha incentivat el desenvolupament de centenars de nous mètodes
estadístics per a complir amb aquest objectiu. Per tant, és primordial disposar
de mètodes que acomodin les distribucions adequades i modelin estructures de
dades complexes. Davant d’això, aquesta tesi presenta avenços en tres
direccions. En primer lloc, l’estudi de diferents mètodes per a analitzar
associacions no lineals, molt rellevant en estudis d’associació entre exposicions
mediambientals (i.e. exposoma) i malalties complexes. Aquesta anàlisi va
acompanyada del desenvolupament del paquet de R nlOmicAssoc. En segon
lloc, es proposa utilitzar la distribució simplex per analitzar dades metilòmiques,
donat que aquesta distribució ajusta els valors beta generats en aquesta mena
d’estudis. També es formula l’extensió a models lineals generalitzats amb
resposta simplex. I per últim, el paquet de R HOmics, que incorpora
coneixement biològic als estudis d’associació mitjançant models Bayesians
jeràrquics. També implementa mètodes per modelar la dependència entre
dades òmiques, permetent la integració de dades
dc.format.mimetype
application/pdf
dc.publisher
Universitat Pompeu Fabra
dc.rights.license
ADVERTIMENT. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.
dc.source
TDX (Tesis Doctorals en Xarxa)
dc.subject
Statistical models
dc.subject
Data distribution
dc.subject
Bioinformatics
dc.subject
Models estadístics
dc.subject
Distribució de dades
dc.subject
Bioinformàtica
dc.title
New approaches in omics data modelling
dc.type
info:eu-repo/semantics/doctoralThesis
dc.type
info:eu-repo/semantics/publishedVersion
dc.contributor.authoremail
lauranonell@gmail.com
dc.contributor.director
González Ruiz, Juan Ramón
dc.rights.accessLevel
info:eu-repo/semantics/openAccess
dc.description.degree
Programa de doctorat en Biomedicina