Tytuł pozycji:
Seskupení přechýlených a podobných příjmení užívaných v České republice pomocí počítačového zpracování dat z registru obyvatel
Most strings of female surnames registered in the Czech Republic are lexically different from related male surnames. This article provides a method of grouping surnames by similarity and computing surname frequencies for these grouped surnames. The method reduces the 251,723 registered surname variants to 142,586 groups. Grouped surname frequencies can be used for linguistic research of similar surnames, determining geographic distribution of surnames, or by researchers which require surname frequencies irrespective of gender.