Tytuł pozycji:
Identification of keywords for legal documents categories using SOM
- Tytuł:
-
Identification of keywords for legal documents categories using SOM
- Autorzy:
-
Puchalska, Paulina
Krzemiński, Kacper
Lis, Maksymilian
Scherer, Rafał
Drozda, Paweł
Komar-Komarowski, Kajetan
Szałapak, Konrad
Sobecki, Andrzej
Zymkowski, Tomasz
Szymański, Julian
- Data publikacji:
-
2025
- Słowa kluczowe:
-
document classification
RoBERTa
NLP
GloVe
NER
SOM
- Język:
-
angielski
- Dostawca treści:
-
BazTech
-
Przejdź do źródła  Link otwiera się w nowym oknie Pełny tekst  Link otwiera się w nowym oknie
This study aims to use the decision-making process to categorize legal documents by identifying keywords characterizing each legal domain class. The study utilizes the Kohonen Self-Organizing Map method and the Global Vectors for Word Representation (GloVe) model to create an efficient document classification system. As a result, a satisfactory classification accuracy of 71.69% was achieved. The article also discusses alternative approaches implemented to improve classification accuracy, such as the use of Named Entity Recognizer (NER) tools and the RoBERTa model, along with a comparison of these approaches’ effectiveness. Challenges related to the uneven distribution of categories in the dataset are also mentioned, and potential directions for further research to enhance the classification results of legal documents are presented.
Opracowanie rekordu ze środków MNiSW, umowa nr POPUL/SP/0154/2024/02 w ramach programu "Społeczna odpowiedzialność nauki II" - moduł: Popularyzacja nauki (2025).