A machine learning ride in the physics theme park: from quantum to biophysics

Author

Requena Pozo, Borja

Director

Lewenstein, Maciej

Codirector

Muñoz Gil, Gorka

Date of defense

2024-04-24

Pages

158 p.



Department/Institute

Universitat Politècnica de Catalunya. Institut de Ciències Fotòniques

Doctorate programs

DOCTORAT EN FOTÒNICA (Pla 2013)

Abstract

(English) The integration of artificial intelligence into research is propelling progress and discoveries across the entire scientific landscape. Artificial intelligence tools boost the development of novel scientific insights and theories by processing extensive data sets, guiding exploration and hypothesis formation, enhancing experimental setups, and even enabling autonomous discovery. In this thesis, we harness the power of machine learning, a sub-field of artificial intelligence, to study non-deterministic systems, which are amongst the hardest to characterize. On one hand, we address problems inherent to the study of quantum systems and the development of quantum technologies. Quantum physics presents formidable challenges due to the associated exponential complexity with the size of the system at hand, as well as its intrinsic stochastic nature and the presence of intricate correlations between its components. We employ reinforcement learning, a machine learning technique that excels at dealing with vast hypothesis spaces, to address some of these challenges. Notably, reinforcement learning has demonstrated super-human performance in multiple complex games like Go, which present similar characteristics to the problems encountered in the study of quantum physics. We use it to systematically simplify complex common problems in condensed matter and quantum information processing tasks, as well as to implement robust calibration schemes for quantum computers. On the other hand, we focus on the characterization of complex stochastic processes, such as diffusion. Understanding diffusion processes is crucial to unravel the complex underlying physical and biological mechanisms governing them. This involves extracting meaningful parameters from the analysis of stochastic trajectories described by tracked particles. However, accurately capturing and analyzing the trajectories presents multiple challenges, stemming from the combination of their random nature, complex dynamics, and experimental drawbacks, such as noise. We develop machine learning algorithms to accurately extract such parameters, even when they vary with time, and demonstrate their applicability in experimental scenarios. Furthermore, we apply similar techniques to study the diffusion of internet users browsing an e-commerce website, predicting their likelihood to make a purchase before closing the session.


(Català) La integració de la intel·ligència artificial a la recerca accelera el progrés cap a nous descobriments en tot l’'àmbit científic. Les eines d’'intel·ligència artificial contribueixen al desenvolupament de noves teories i coneixements processant grans quantitats de dades, guiant l’'exploració i la formulació d'’hipòtesis, millorant els experiments i, fins i tot, fent possible descobriments automàtics. En aquesta tesi, aprofitem el poder de l’'aprenentatge automàtic (“"machine learning”"), un camp de la intel·ligència artificial, per estudiar sistemes no-deterministes, que es troben entre els més difícils de caracteritzar. Per una banda, tractem problemes inherents a l’'estudi de sistemes quàntics i del desenvolupament de noves tecnologies quàntiques. La física quàntica planteja reptes formidables derivats de la complexitat exponencial amb la mida del sistema considerat, en combinació amb una naturalesa intrínsicament estocàstica i la presència de correlacions complexes entre elements del sistema. Per tractar alguns d’'aquests reptes, fem servir aprenentatge de reforç (“"reinforcement leraning”"), una tècnica de l'aprenentatge automàtic capaç d’'explorar grans espais d'’hipòtesis. Per exemple, empleant aquestes tècniques, s'’ha aconseguit superar als millors jugadors del món en jocs complexes com el Go, que presenten característiques similars a problemes emergents en l’'estudi de la quàntica. En el nostre cas, desenvolupem mètodes per simplificar problemes complexes comuns en els camps de la matèria condensada i de la informació quàntica de forma sistemàtica, i disenyem protocols robustos de cal·libració d’'ordinadors quàntics. Per l’altra banda, ens dediquem a la caracterització de processos estocàstics complexes, com és la difusió. Entendre els processos de difusió és essencial per descobrir els mecanismes físics i biològics que els governen, el que comporta l’'anàlisi de trajectòries estocàstiques descrites per partícules per tal d’extruere’n paràmetres significatius del sistema. Aquest anàlisi, però, presenta grans reptes des de l’'adquisició de les trajectòries fins al seu estudi posterior que provenen, principalment, de la combinació de la seva naturales aleatòria, amb la presència de dinàmiques complexes i altres inconvenients experimentals, com ara el soroll. Utilitzant tècniques d’aprenentatge automàtic, desenvolupem algoritmes per analitzar aquestes trajectòries i extreure’n els paràmetres d’interès acuradament, fins i tot quan aquests canvien amb el temps. Després, utilitzem aquests algoritmes per estudiar diferents experiments en sistemes biològics i, també, per estudiar les trajectòries descrites per usuaris navegant una pàgina de comerç online. En aquest últim cas, en comptes d'extreure paràmetres físics, inferim si l'usuari farà una compra abans de tancar la sessió.

Subjects

004 - Computer science; 530.1 - General principles of physics; 577 - Biochemistry. Molecular biology. Biophysics

Knowledge Area

Àrees temàtiques de la UPC::Física; Àrees temàtiques de la UPC::Informàtica

Note

Tesi amb menció de Doctorat Internacional

Documents

TBRP1de1.pdf

6.202Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-nc-nd/4.0/

This item appears in the following Collection(s)