Tytuł pozycji:
The optimal number of tetrads for measurement of dissimilarities in nonmetric multidimensional scaling
Bezpośrednie wyznaczanie niepodobieństw jest najpopularniejszym i najczęściej stosowanym sposobem uzyskiwania danych wejściowych w niemetrycznym skalowaniu wielowymiarowym, czyli gdy zmienne są mierzone na skali porządkowej (np. w badaniach preferencji). Stosowanie większości metod bezpośredniego pomiaru podobieństwa, takich jak rangowanie, sortowanie, porównania parami czy warunkowe porządkowanie podobieństw, jest jednak bardzo pracochłonna, zwłaszcza przy dużej liczbie obiektów. Z tego powodu w badaniu omawianym w niniejszym artykule posłużono się metodą tetrad – nieskomplikowaną i nieuciążliwą dla respondentów. Proponowana metoda polega na przedstawieniu respondentom do oceny czteroelementowe podzbiory (tetrady) z n-elementowego zbioru obiektów. Respondent proszony jest o wskazanie pary najbardziej i najmniej podobnych elementów w każdej tetradzie. Ponieważ liczba tetrad rośnie bardzo szybko wraz z liczbą obiektów, niezbędne jest zastosowanie niepełnego wariantu tej metody, w której respondentom przedstawia się do oceny jedynie część czteroelementowych podzbiorów. Badanie omawiane w artykule ma na celu ustalenie wielkości zbioru tetrad, która jest wystarczająca do wyznaczenia macierzy niepodobieństw służącej do wykonania niemetrycznego skalowania wielowymiarowego. Badanie przeprowadzono na podstawie czterech macierzy odległości dla 7, 9, 11 i 13 obiektów, którymi były losowo wybrane miasta wojewódzkie w Polsce. Odległości między miastami wyrażono w kilometrach. Wykorzystano analizę Prokrustesa oraz współczynnik korelacji rang Spearmana. Wykazano, że zastosowanie metody tetrad do pomiaru niepodobieństw daje korzystne wyniki już wtedy, gdy każda para obiektów pojawia się w zbiorze tetrad tylko raz, co pozwala na znaczne ograniczenie liczby opinii wyrażanych przez respondentów.
The direct determination of dissimilarities is the most popular and most frequently used method for raising input data in nonmetric multidimensional scaling, i.e. when variables are measured on an ordinal scale (e.g. in preference studies). Most methods for the direct measurement of similarities, including ranking, sorting, pairwise comparison, conditional ranking of similarities are, however, very laborious, especially when a large number of objects is tested. Thus, the research described in this article is based on the tetrad method, which is uncomplicated and less burdensome for the respondents. In the proposed method, respondents are asked to evaluate four-element subsets (tetrads) from a set of n objects. The respondent is asked to indicate the pair with the most and the least similar elements in each tetrad. As the number of tetrads rapidly increases along with the number of objects, it becomes necessary to use the incomplete variant of the method, in which only some four-element subsets are presented to the respondents for evaluation. The aim of the research presented in the article is to determine the size of the tetrad set that is sufficient to create a dissimilarity matrix used to perform nonmetric multidimensional scaling. The study was based on four distance matrices for 7, 9, 11 and 13 objects that were randomly selected voivodship capitals in Poland. The distances between the cities were expressed in kilometres. The Procrustes analysis and Spearman's rank correlation were used in the study. The findings show that the use of the tetrad method for the measurement of dissimilarities produces beneficial results already at the point when each pair of objects appears in the set of tetrads only once, which allows the number of opinions provided by the respondents to be significantly reduced.