Informacja

Drogi użytkowniku, aplikacja do prawidłowego działania wymaga obsługi JavaScript. Proszę włącz obsługę JavaScript w Twojej przeglądarce.

Tytuł pozycji:

Corpora of Slavic languages

Tytuł:
Corpora of Slavic languages
Autorzy:
Chachulska B.
Gorski R.L.
Tematy:
CORPORA OF SLAVIC LANGUAGES
PHILOLOGY & LINGUISTICS
Język:
polski
Dostawca treści:
CEJSH
Artykuł
  Przejdź do źródła  Link otwiera się w nowym oknie
The aim of this paper is a presentation of corpora of Slavic languages. A corpus for almost every Slavic language either was compiled or shall be finished very soon. Some languages can be studied with help of several corpora. To the knowledge of the authors the exceptions are: Belorussian, Kashubian (if we agree that it is a language not a dialect) and Macedonian. The corpora are mostly accessible via Internet and meet the standards set by British National Corpus: their size ranges from 30 to 100 million running words, are balanced and morphosyntactically anotated. Interestingly, there is no interdependence between the position of a certain language and the quality of its corpus. Countries with relatively little population (e.g. Slovenia) can afford large and sophisticated corpora, while even if there are several corpora of Russian, none of them meets the standards which are nowadays required.

Ta witryna wykorzystuje pliki cookies do przechowywania informacji na Twoim komputerze. Pliki cookies stosujemy w celu świadczenia usług na najwyższym poziomie, w tym w sposób dostosowany do indywidualnych potrzeb. Korzystanie z witryny bez zmiany ustawień dotyczących cookies oznacza, że będą one zamieszczane w Twoim komputerze. W każdym momencie możesz dokonać zmiany ustawień dotyczących cookies