Tytuł pozycji:
Syntax-based distance for multilevel multidimensional decision rules
One of the central problem in data mining is to filter large sets of discovered patterns. Our experience shows that this task should be done not for a single rule but by taking into considerations other similar rules. To fulfil this requirement the author proposes a new syntax-based distance measure dedicated for multilevel multidimensional rules as well as a rules’ neighbourhood with variable radius and a rule’s interestingness within the neighbourhood. Included example presents one of the possible usage of the proposed definitions in analysis of data from fault simulations.
Badania pokazują, że wybór istotnych wzorców z dużych zbiorów reguł powinien być dokonywany nie na podstawie pojedynczej reguły, ale w powiązaniu z regułami podobnymi. Aby zrealizować to zadanie, autorka proponuje nową syntaktyczną miarę odległości miedzy wielopoziomowymi wielowymiarowymi regułami decyzyjnymi i definicje: sąsiedztwa reguły ze zmiennym promieniem oraz atrakcyjności reguły w sąsiedztwie. Artykuł zawiera tak˙ze przykład wykorzystania zaproponowanych definicji w analizie danych z symulatorów błędów.