Catarina de Nazaré Pereira Pinheiro
Resumo
Esta tese investiga o uso de modelos de redes neurais com aprendizado auto-supervisionado para o processamento de dados sísmicos. O trabalho aborda duas aplicações: atenuação de ruídos e segmentação de fácies. Dado o desafio da disponi-bilidade limitada de dados rotulados e os elevados custos associados à sua aquisição, o aprendizado auto-supervisionado permite a modelagem eficaz, reduzindo a depen-dência de dados rotulados. Na segmentação de fácies, foram adaptados dois métodos contrastivos que extraem representações significativas a partir de diferentes visões dos mesmos dados. A avaliação, realizada com a métrica MIoU no conjunto de da-dos público Parihaka, mostrou que um dos métodos obteve resultados competitivos com o supervisionado, considerando tempo e quantidade de dados, enquanto o outro apresentou desempenho inferior. Na atenuação de ruídos, duas metodologias auto-supervisionadas foram desenvolvidas com abordagem zero-shot em 100 imagens de treinamento e teste, utilizando dados sintéticos com ruído gaussiano e ruído real de aquisições sísmicas. A comparação entre os métodos foi feita de forma quanti-tativa, utilizando a métrica PSNR nas mesmas 100 amostras de teste para todos os modelos, e qualitativa, analisando a remoção de sinal e ruído para cada mé-todo. Para validar os resultados, os dois métodos propostos foram comparados com um método auto-supervisionado amplamente utilizado e um método supervisionado padrão, garantindo uma referência para a análise de desempenho. As abordagens auto-supervisionadas demonstraram potencial competitivo em relação aos métodos supervisionados, especialmente pela independência de rótulos e pela necessidade de apenas uma única imagem para treino.
Abstract
This thesis investigates the use of self-supervised neural network models for seis-mic data processing. The study focuses on two applications: noise attenuation and facies segmentation. Given the challenge of limited availability of labeled data and the high costs associated with data acquisition, self-supervised learning enables effec-tive modeling while reducing reliance on labeled datasets. In the facies segmentation task, two contrastive methods were adapted to extract meaningful representations from different views of the same data. Evaluation using the Mean Intersection over Union (MIoU) metric on the publicly available Parihaka dataset showed that one method achieved performance competitive with supervised approaches in terms of time and data efficiency, while the other underperformed. For noise attenuation, two self-supervised methodologies were developed using a zero-shot approach on 100 training and testing images, leveraging synthetic data with Gaussian noise and real noise from seismic acquisitions. The methods were compared quantitatively using the Peak Signal-to-Noise Ratio (PSNR) metric on the same 100 test sam-ples across all models, and qualitatively by analyzing signal preservation and noise removal for each approach. To validate the results, the proposed methods were benchmarked against a widely used self-supervised approach and a standard super-vised method, providing a reference for performance analysis. The self-supervised approaches demonstrated competitive potential compared to supervised methods, particularly due to their independence from labeled data and their ability to train using only a single image.

