Tytuł pozycji:
Comparative performance analysis of deep learning architectures in underwater image classification
In this study, we assess the performance of the VGG-16, EfficientNetB0, and SimCLR models in classifying 5,000 underwater images. The dataset was split into 75 perceent for training and 25 percent for testing, with manual labeling ensuring accurate ground truth. We used K-means clustering to segment the dataset based on similarity, and PCA to reduce dimensionality while maintaining the semantic structure. The diverse dataset boosts the models’ ability to generalize across various conditions. We evaluated clustering and classification using the silhouette score, Davies-Bouldin index, and Calinski-Harabasz index. The results reveal each model’s strengths and weaknesses, providing insights for future improvments in underwater image analysis.
W tym badaniu oceniamy wydajność modeli VGG-16, EfficientNetB0 i SimCLR w klasyfikacji 5000 podwodnych zdjęć. Zbiór danych podzielono na 75 procent do celów szkoleniowych i 25 procent do testów, przy czym ręczne etykietowanie zapewniało dokładne odwzorowanie podstaw. Zastosowaliśmy grupowanie K-średnich do segmentacji zbioru danych na podstawie podobieństwa oraz PCA w celu zmniejszenia wymiarowości przy jednoczesnym zachowaniu struktury semantycznej. Zróżnicowany zbiór danych zwiększa zdolność modeli do uogólniania w różnych warunkach. Oceniliśmy grupowanie i klasyfikacje za pomocą wyniku sylwetki, wskaźnika Daviesa-Bouldina i wskaźnika Calinskiego-Harabasza. Wyniki ujawniają mocne i słabe strony każdego modelu, dostarczając informacji na temat przyszłych ulepszeń w analizie obrazów podwodnych.
Opracowanie rekordu ze środków MNiSW, umowa nr POPUL/SP/0154/2024/02 w ramach programu "Społeczna odpowiedzialność nauki II" - moduł: Popularyzacja nauki (2025).