Tytuł pozycji:
Algorithmic image analysis ‒ building detection in aerial photos
The article presents the results of research comparing edge detection methods in digital images and verifying their usefulness in the context of the automatic vectorization process. As part of the experiment, well-known edge detection algorithms based on the analysis of derivatives of image quality functions (Sobel, Canny, Kirch) were implemented. The research problems of the article in the case of building detection basically boil down to the identification of homogeneous areas, the detection of edges or points in a digital image. The original program developed in the Matlab environment made it possible to obtain a description of the edges and their approximation with straight lines, as well as to analyze the quality of the obtained results. In addition, the validity of using neural networks was also analyzed in this context. The neural networks used an algorithm obtained from the GitHub hosting website and implemented as a plug-in for QGIS 3.26. Another attempt at algorithmic image analysis was based on the use of the GAN technique, i.e. the use of a generative network architecture that acts as an algorithm using the potential of two mutually opposed networks whose task is to generate a synthetic result. Under this assumption, one network is the so-called data generator and the other is the discriminator, critically assessing the generating network for authenticity. For each algorithm, the accuracy of vectorization of the detected edges was calculated. The most promising in this respect was an artificial intelligence algorithm using the technique of generative adversarial networks.
W artykule przedstawiono wyniki badań porównujących metody detekcji krawędzi w obrazach cyfrowych i weryfikujących ich przydatność w kontekście procesu automatycznej wektoryzacji. W ramach eksperymentu zaimplementowano znane algorytmy detekcji krawędzi oparte na analizie pochodnych funkcji jakości obrazu (Sobel, Canny, Kirch). Problemy badawcze artykułu w przypadku detekcji budynków sprowadzają się zasadniczo do identyfikacji obszarów jednorodnych, detekcji krawędzi lub punktów w obrazie cyfrowym. Oryginalny program opracowany w środowisku Matlab umożliwił uzyskanie opisu krawędzi i ich aproksymację liniami prostymi, a także analizę jakości uzyskanych wyników. Ponadto w tym kontekście przeanalizowano również zasadność wykorzystania sieci neuronowych. Sieci neuronowe wykorzystały algorytm pobrany ze strony hostingowej GitHub i zaimplementowany jako wtyczka do QGIS 3.26. Kolejna próba algorytmicznej analizy obrazu oparta została na wykorzystaniu techniki GAN, czyli wykorzystaniu generatywnej architektury sieciowej, która działa jako algorytm wykorzystujący potencjał dwóch wzajemnie przeciwstawnych sieci, których zadaniem jest wygenerowanie syntetycznego wyniku. Przy tym założeniu jedna sieć jest tzw. generatorem danych, a druga dyskryminatorem, krytycznie oceniającym sieć generującą pod kątem autentyczności. Dla każdego algorytmu obliczano dokładność wektoryzacji wykrytych krawędzi. Najbardziej obiecujący pod tym względem okazał się algorytm sztucznej inteligencji wykorzystujący technikę generatywnych sieci adwersaryjnych.
Opracowanie rekordu ze środków MNiSW, umowa nr POPUL/SP/0154/2024/02 w ramach programu "Społeczna odpowiedzialność nauki II" - moduł: Popularyzacja nauki (2025).