Tytuł pozycji:
Analiza porównawcza modeli CNN do rozpoznawania cyfr pisma odręcznego
W artykule podejmowana jest tematyka konwolucyjnych sieci neuronowych wykorzystywanych do klasyfikacji cyfr pisma odręcznego. Celem badań jest ocena dokładności, wydajności oraz czasu treningu i klasyfikacji trzech sieci OCR (VGG-16, VGG-19 i AlexNet) oraz porównanie ich między sobą wybierając przy tym ten najbardziej optymalny. Do badań wykorzystano popularny zestaw danych MNISTskładający się z 70 000 obrazów. Dla każdego modelu przepro-wadzono wstępne badanie w celu określenia optymalnej liczby danych wejściowych oraz liczbę epok treningowych. Wyniki badańwskazują, że pomimo dłuższego czasu treningu i klasyfikacji, model AlexNet osiągnął najwyższe wynikiw zakresie precyzji, czułości oraz F1-score, co wskazuje na jego zdolność do skutecznej klasyfikacji obrazów.
The paper discusses the subject of convolutional neural networks used for handwritten digit classification. The purpose of the research is to evaluate the accuracy, performance, training, and classification time of three OCR networks (VGG-16, VGG-19 and AlexNet) and compare them with each other while selecting the most optimal one. The popular MNIST dataset of 70,000 images was used for the study. For each model, a preliminary study was conducted to determine the optimal parameters in the form of the number of input data and number of training epochs. The result of the work indicates that, despite the longer training and classification time, the AlexNet model achieved the highest precision, recall, and F1-score, indicating its ability to effectively classify images.
Opracowanie rekordu ze środków MNiSW, umowa nr POPUL/SP/0154/2024/02 w ramach programu "Społeczna odpowiedzialność nauki II" - moduł: Popularyzacja nauki (2025).