Multiplex analysis of circRNAs in lung cancer using the nCounter technology

Author

Pedraz Valdunciel, Carlos

Director

Rosell Costa, R.

Tutor

Bassols Teixidó, Anna Maria

Date of defense

2022-11-23

Pages

203 p.



Doctorate programs

Universitat Autònoma de Barcelona. Programa de Doctorat en Bioquímica, Biologia Molecular i Biomedicina

Abstract

El càncer de pulmó (CP) és un dels càncers més comunament diagnosticats i la principal causa de mort relacionada amb el càncer a tot el món, principalment degut al seu diagnòstic en estadis tardans i a la manca de tractaments efectius per a un nombre significatiu de pacients. En conseqüència, avanços en el diagnòstic precoç del CP són essencials per a poder millorar la supervivència global d’aquests pacients. Els ARN circulars (circRNA) són un tipus d’ARN amb una estructura estable i una expressió teixit específica. Diversos treballs científics indiquen com l’expressió anormal d’alguns circRNA pot exercir un paper en la carcinogènesis i la progressió del tumor. En aquest context, molts laboratoris estan investigant actualment el valor clínic dels circRNAs que es troben en les biòpsies líquides. Desafortunadament, la falta d’una metodologia estandarditzada per a l’estudi de circRNAs, a més de les limitacions inherents a les biòpsies líquides, està frenant la seva implementació clínica. El sistema nCounter de NanoString pot quantificar els nivells d’expressió de fins a 800 molècules de ARNs extretes de material fixat en formalina i inclòs en parafina (FFPE), lisats cel·lulars o biòpsies líquides. Les avantatges d’aquesta plataforma són la brevetat del seu protocol, així com la seva capacitat per a treballar amb molt poca quantitat de mostra altament degradada. No obstant això, fins on nosaltres sabem, no hi ha evidència sobre l’ús d’aquesta plataforma per a l’estudi dels circRNAs en mostres de CP. Per això, el principal objectiu d’aquesta tesi ha estat testar la tecnologia nCounter per a l’estudi de l’expressió dels circRNAs en mostres de CP, incloent-hi línies cel·lulars, mostres FFPE i biòpsies líquides. En el capítol 2, presentem un estudi de nCounter per a la detecció de circRNA en mostres de CP. Primerament, vam dissenyar i validar en línies cel·lulars de CP un panell de circRNAs per a nCounter. Després, el panell es va utilitzar per a estudiar l’expressió de circRNAs en biòpsies de teixit. Com a resultat, trobem un grup de circRNAs diferencialment expressats en CP (n = 53), enfront de controls sense càncer (n = 16). A més, l’anàlisi d’aprenentatge automàtic (Machine Learning, ML) ens va permetre desenvolupar dues signatures de circRNA per a discriminar biòpsies de CP, d’estadis primerencs i tardans, de mostres no tumorals. En el capítol 3, vam validar un protocol per a l’anàlisi dels circRNAs continguts en les vesícules extracel·lulars (EVs) per nCounter. Posteriorment, vam utilitzar el nostre protocol per analitzar els EV-circRNAs en mostres de plasma de pacients amb CP (n = 36) i controls sense càncer (n = 30). Novament, vam trobar un grup d’EV-circRNAs expressats diferencialment en mostres de pacients amb càncer que podrien usar-se potencialment com biomarcadors de CP. A més, ML ens va permetre trobar una signatura de 10 circRNAs que va permetre diferenciar les mostres de CP dels controls. La purificació dels EVs és un procés que pot resultar difícil d’implementar en l’entorn clínic. En conseqüència, en el capítol 4, vam analitzar nCounter en mostres d’RNA extretes directament de plasma, detectant una major quantitat de circRNAs en aquestes mostres en comparació amb aquelles enriquides en EV. Després, vam analitzar mostres de plasma de pacients amb CP en estadi primerenc (n=49) i de controls sense càncer (n=49), els quals incloïen també individus amb nòduls benignes (n=19/49). Posteriorment, a través de ML, vam poder generar una signatura per discriminar el CP en etapa primerenca amb un àrea sota la corba (AUC) ROC de 0.9. En conclusió, aquesta tesi ha demostrat que nCounter es pot utilitzar per a l’estudi de circRNAs en mostres de CP, establint les bases per al desenvolupament d’assajos de circRNA clínicament rellevants.


El cáncer de pulmón (CP) es uno de los tipos de cáncer más comúnmente diagnosticados y la principal causa de muerte relacionada con cáncer en todo el mundo, principalmente debido a su diagnóstico en estadíos avanzados y a la falta de tratamientos efectivos para un número significativo de pacientes. En consecuencia, avances en el diagnóstico precoz de esta enfermedad son necesarios para poder mejorar la supervivencia de estos pacientes. Los ARN circulares (circRNA) son un tipo de ARN que muestra una estructura estable y una expresión específica a cada tejido. Numerosos trabajos científicos muestran cómo la expresión anormal de algunos circRNAs puede desempeñar un papel importante en la carcinogénesis y la progresión del tumor. En este contexto, muchos laboratorios están investigando el valor clínico de los circRNAs que se encuentran presentes en las biopsias líquidas. Desafortunadamente, la falta de un método estandarizado para el estudio de circRNAs, además de las limitaciones inherentes a las biopsias líquidas, está frenando su implementación clínica. El sistema nCounter de NanoString puede cuantificar los niveles de expresión de hasta 800 moléculas de ARN extraídas de material fijado en formalina e incluido en parafina (FFPE), lisados celulares o biopsias líquidas. Entre las diferentes ventajas de esta plataforma, destacan la brevedad de su protocolo, así como su capacidad para trabajar con muy poca cantidad de muestras altamente degradadas. Sin embargo, hasta donde nosotros sabemos, no hay evidencia sobre el uso de esta plataforma para el estudio de circRNAs en muestras de CP. Por ello, el principal objetivo de esta tesis ha sido testar la tecnología nCounter para el estudio de la expresión de circRNAs en muestras de CP, incluyendo líneas celulares, muestras FFPE y biopsias líquidas. En el capítulo 2, presentamos un estudio donde hacemos uso del nCounter para la detección de circRNAs en muestras de CP. Primero, diseñamos y validamos en líneas celulares un panel de circRNAs para nCounter. Después, utilizamos nuestro panel para estudiar la expresión de circRNAs en biopsias de tejido. Como resultado, encontramos un grupo de circRNAs diferencialmente expresado en CP (n = 53), frente a controles sin cáncer (n = 16). Además, análisis de aprendizaje automático (en inglés, Machine Learning, ML) nos permitió desarrollar dos firmas de circRNAs para discriminar biopsias de CP de muestras no tumorales. En el capítulo 3, establecimos y validamos un protocolo para el análisis de circRNAs contenidos en las vesículas extracelulares (EVs) por nCounter. Posteriormente, usamos nuestro protocolo para analizar EV-circRNAs en muestras de plasma de pacientes con CP (n = 36) y controles sin cáncer (n = 30). Nuevamente, encontramos un grupo de EV-circRNAs diferencialmente expresados en muestras de pacientes con cáncer que podrían usarse potencialmente como biomarcadores de CP. Además, ML nos permitió encontrar una firma de 10 circRNAs que permitió diferenciar las muestras de cáncer de los controles. La purificación de EVs es un proceso que puede resultar difícil de implementar en el entorno clínico. En consecuencia, en el capítulo 4 probamos nCounter en muestras de RNA extraídas directamente de plasma, detectando una mayor cantidad de circRNAs en estas muestras en comparación con preparados de EVs. Después, analizamos muestras de plasma de pacientes con CP en estadío temprano (n=49) y de controles sin cáncer (n=49), los cuales incluían también individuos con nódulos benignos (n=19/49). Finalmente, a través de ML, pudimos generar una firma para discriminar el CP en etapa temprana con un área bajo la curva (AUC) ROC de 0.9. En conclusión, esta tesis ha demostrado que la plataforma nCounter puede ser utilizada para el estudio de circRNAs en muestras de CP, sentando las bases para el desarrollo de ensayos de circRNAs clínicamente relevantes.


Lung cancer stands as one of the two most commonly diagnosed types of cancer, and the foremost cause of cancer-related death worldwide, primarily due to a late-stage diagnosis and lack of effective treatments for a significant number of patients. Although innovative single-agent therapies and their combination are constantly being tested in clinical trials, the five-year survival rate of late-stage lung cancer remains only at 5% (Cancer Research, UK). Consequently, advances in the early diagnosis of lung cancer are critical for improving the overall survival. Circular RNAs (circRNAs) are a re-discovered type of RNA showing a stable structure and tissue-specific expression. Accumulating evidence indicates how abnormal expression of some circRNAs can play a role in carcinogenesis and tumor progression, positioning these molecules as putative lung cancer biomarkers. In this context, many laboratories are currently investigating the clinical value of circRNAs found in liquid biopsies. Unfortunately, the lack of standardized methodologies for the study of circRNAs, together with some limitations inherent to liquid biopsies, is holding back their clinical implementation. The NanoString nCounter system can quantify the expression levels of up to 800 RNAs extracted from formalin-fixed paraffin-embedded (FFPE) material, cell lysates or liquid biopsies. Among the different advantages of this platform, we can highlight its short turnaround time and the ability to work with very low quantity of highly degraded samples. However, to the best of our knowledge, there is no published evidence on the use of this platform for the study of circRNAs in lung cancer specimens. Therefore, the main objective of this doctoral thesis was to test the nCounter technology for the study of circRNA expression in lung cancer samples, including cell lines, FFPE samples and liquid biopsies. In Chapter 2, we present a proof-of-concept study of nCounter for the detection of circRNAs in lung cancer samples. First, we designed and validated a customized nCounter circRNA panel in lung cancer cell lines. Then, the panel was used to study circRNA expression in tissue biopsies. As a result, we found a cluster of differentially expressed circRNAs in early and late-stage lung cancer (n=53) vs. non-cancer controls (n=16). Also, machine learning (ML) analysis allowed us to develop two circRNA signatures to discriminate early and late-stage lung cancer biopsies from non-tumor samples with high accuracy. In Chapter 3, we transitioned from solid specimens to liquid biopsies. In this second proof-of-concept study, we established and validated a protocol for the analysis of extracellular vesicle (EV)-circRNAs by nCounter. To this end, we tested different key points such as initial volume of plasma, EV purification method, number of cycles of pre-amplification, data normalization procedures or ML approaches. Then, we used the protocol to analyze the EV-circRNAs in plasma samples of lung cancer patients (n=36) and non-cancer controls (n=30). Again, we found a cluster of differentially expressed EV-circRNAs that could potentially be used as biomarkers of lung cancer. Also, ML allowed us to find a 10-circRNA signature that discriminated lung cancer samples from controls. Purification of EVs may result challenging to implement in the clinical setting. Consequently, in Chapter 4, we tested nCounter in whole plasma and detected a higher number of circRNAs compared to EV-enriched samples. Then, we analyzed plasma samples of early-stage lung cancer patients (n=49) and non-cancer controls (n=49), which included individuals with benign nodules (n=19/49). Subsequently, ML techniques generated a signature to discriminate early-stage lung cancer with an area under the ROC curve (AUC ROC) of 0.9. In conclusion, this thesis has proved that nCounter can be used for the study of circRNAs in lung cancer samples, setting the ground for the development of clinically relevant circRNA assays.

Keywords

Càncer; Cáncer; Cancer; Circrna; Diagnòstic; Diagnóstico; Diagnostic

Subjects

00 - Prolegomena. Fundamentals of knowledge and culture. Propaedeutics

Knowledge Area

Ciències de la Salut

Documents

This document contains embargoed files until 2024-05-21

Rights

ADVERTIMENT. Tots els drets reservats. L'accés als continguts d'aquesta tesi doctoral i la seva utilització ha de respectar els drets de la persona autora. Pot ser utilitzada per a consulta o estudi personal, així com en activitats o materials d'investigació i docència en els termes establerts a l'art. 32 del Text Refós de la Llei de Propietat Intel·lectual (RDL 1/1996). Per altres utilitzacions es requereix l'autorització prèvia i expressa de la persona autora. En qualsevol cas, en la utilització dels seus continguts caldrà indicar de forma clara el nom i cognoms de la persona autora i el títol de la tesi doctoral. No s'autoritza la seva reproducció o altres formes d'explotació efectuades amb finalitats de lucre ni la seva comunicació pública des d'un lloc aliè al servei TDX. Tampoc s'autoritza la presentació del seu contingut en una finestra o marc aliè a TDX (framing). Aquesta reserva de drets afecta tant als continguts de la tesi com als seus resums i índexs.

This item appears in the following Collection(s)