Advanced Machine Learning for EELS Spectroscopy: Magnetic Characterization, Classification and Data Generation

Author

Pozo Bueno, Daniel del

Director

Peiró Martínez, Francisca

Estradé Albiol, Sònia

Tutor

Estradé Albiol, Sònia

Date of defense

2024-12-19

Pages

234 p.



Department/Institute

Universitat de Barcelona. Departament d'Enginyeria Electrònica i Biomèdica

Abstract

[eng] This PhD thesis explores the use of Machine Learning (ML) techniques to develop advanced methods for the analysis of Electron Energy Loss Spectroscopy (EELS) spectra. EELS is mainly used in Scanning Transmission Electron Microscopy (STEM) to measure the energy loss by electrons as they pass through a thin sample (typically a few tens of nanometers thick). This energy loss provides valuable information about the composition, chemical bonding, and electronic structure of the sample being studied. However, the complexity and large volume of data generated by EELS make manual analysis time-consuming and inaccurate. To address these challenges, this thesis proposes the integration of ML techniques with EELS data to automate and improve the analysis. First, the thesis provides a comprehensive review of ML applications in EELS, analyzing supervised and unsupervised methods. Following this, the study employs Electron Magnetic Circular Dichroism (EMCD) to characterize bi-magnetic nanocubes with a core/shell (FeO/Fe3O4) structure. By combining EMCD with unsupervised ML, particularly K-means clustering, we identified magnetic regions and found a correlation between the structural and magnetic properties of the material. This analysis revealed an onion-like concentric structure in the nanocubes, with a decreasing magnetic moment from the surface to the core, linked to oxidation gradients and composition changes. These results demonstrate that combining the compositional mapping of EELS with EMCD gives valuable understanding of the magnetic interfaces in nanomaterials. Next, ML is applied, specifically, the soft-margin Support Vector Machine (SVM), to classify the oxidation states of transition metals such as iron and manganese. These metals have characteristic EELS features known as white lines, which are sensitive to the oxidation state. By training SVM models on these spectral features, an accurate classification of the oxidation states was achieved. This analysis also highlights the challenges posed by noise and energy shifts in the data, which can complicate classification. To address these issues, this thesis proposes techniques to reduce their impact, improving the robustness of the classification models. In addition to SVMs, this thesis also investigates the application of Artificial Neural Networks (ANNs) to classify oxidation states in EELS spectra. By directly comparing the performance of SVMs and ANNs, the study emphasizes the strengths and weaknesses of each approach. ANN models are refined through an extensive search for optimal hyperparameters and network architectures, focusing on both dense and convolutional structures. These models demonstrate a strong accuracy for classifying EELS spectra. Moreover, convolutional ANNs emerge as the most effective architecture, achieving precision similar to SVMs but requiring significantly more training data and computational power. CNNs have been found to need a large amount of training data to obtain robust and generalizable models, which implies a higher computational effort and longer training times. In contrast, SVMs, with fewer parameters to optimize, are more suitable for situations with limited data volumes, maintaining efficient and precise performance. To further enhance data diversity, this thesis proposes a data augmentation strategy using Generative Adversarial Networks (GANs). Given that EELS can sometimes provide a limited amount of experimental data (beam-sensitive samples) for training supervised ML models, GANs are employed to generate synthetic EELS spectra. These synthetic datasets help expand the training dataset, improving the performance and precision of the classification models. The thesis presents a functional architecture for both the GAN generator and the discriminator, as well as the process of generating and validating synthetic data. By augmenting the dataset in this way, the research demonstrates how GANs can be a powerful tool to overcome data scarcity, leading to a more robust training of supervised ML models for EELS spectra. In conclusion, this thesis presents a significant advancement in the integration of ML with EELS for material characterization. Through the use of SVMs, ANNs, and GANs, this research improves the classification and analysis of complex EELS data and opens new possibilities for generating synthetic data to support supervised ML models.


[cat[ Aquesta tesi doctoral es centra en la integració de tècniques avançades d'aprenentatge automàtic amb l'espectroscòpia de pèrdua d'energia d'electrons (EELS) per a la caracterització magnètica, la classificació d'estats d'oxidació i la generació de dades. Mitjançant un enfocament innovador, s'aborden els reptes associats amb l'anàlisi de grans quantitats d'espectres i la limitada disponibilitat de dades etiquetades. En primer lloc, es realitza una revisió exhaustiva de l'aprenentatge automàtic aplicat a l'EELS, destacant tant els mètodes supervisats com no supervisats, i el seu impacte significatiu en la precisió i l'eficiència en l'anàlisi de dades. Seguidament, es presenta l'ús de la tècnica de dicroisme circular magnètic d'electrons (EMCD) per a la caracterització de nanocubs amb estructura de nucli/closca. L'EMCD s'ha combinat amb tècniques d'aprenentatge automàtic no supervisat, com l'agrupament K-means, per identificar regions magnètiques i correlacionar les propietats magnètiques i estructurals dels materials. Aquesta anàlisi ha revelat una estructura concèntrica dels nanocubs, amb un moment magnètic decreixent des de la superfície cap al nucli, relacionat amb el gradient d'oxidació. La tesi també explora la classificació automàtica de l'estat d'oxidació dels metalls de transició, en particular, ferro i manganès, mitjançant màquines de vectors de suport (SVM). Les SVM s'han mostrat molt eficients en l'anàlisi d'EELS, aconseguint una precisió superior al 90% en la identificació d'estats d'oxidació basant-se en les línies blanques dels espectres. Addicionalment, es detallen mètodes d'optimització i normalització per millorar la robustesa dels models en condicions experimentals adverses. A més, es compara el rendiment de les SVM amb les xarxes neuronals artificials (ANN) per a la classificació dels estats d'oxidació. Les ANN convolucionals ofereixen nivells de precisió similars o superiors a les SVM, superant el 90%. Tot i això, requereixen grans quantitats de dades d'entrenament per obtenir models generalitzables, mentre que les SVM són més adequades per a volums de dades limitats. Finalment, es proposa una augmentació de dades utilitzant xarxes generatives adversàries (GAN), permetent la generació d’espectres d’EELS sintètics de bona qualitat que imitin la variabilitat inherent dels espectres experimentals. Aquesta estratègia permet incrementar significativament la diversitat i el volum de dades disponibles per entrenar classificadors supervisats. Demostrant que entrenant-los amb dades generades poden classificar espectres experimentals. En resum, aquesta tesi demostra que l'aprenentatge automàtic pot millorar significativament l'anàlisi i interpretació de les dades d’EELS, oferint eines més eficients per a l'estudi de materials a escala nanomètrica.

Keywords

Espectroscòpia de pèrdua d'energia d'electrons; Espectroscopía por pérdidas de energía de electrones; Electron energy loss spectroscopy; Microscòpia electrònica d'escombratge; Microscopía electrónica de barrido; Scanning electron microscopy; Aprenentatge automàtic; Aprendizaje automático; Machine learning; Xarxes neuronals (Informàtica); Redes neuronales (Informática); Neural networks (Computer science)

Subjects

62 - Engineering

Knowledge Area

Ciències Experimentals i Matemàtiques

Note

Programa de Doctorat en Nanociències

Documents

DdPB_PhD_THESIS.pdf

81.11Mb

 

Rights

L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/
L'accés als continguts d'aquesta tesi queda condicionat a l'acceptació de les condicions d'ús establertes per la següent llicència Creative Commons: http://creativecommons.org/licenses/by-sa/4.0/

This item appears in the following Collection(s)