Eksploracja danych
Metody i algorytmy
Rozwój oraz upowszechnienie rozwiązań technologicznych służących gromadzeniu
informacji sprawiły, że we wszystkich obszarach działalności człowieka mamy do
czynienia z przechowywaniem i przetwarzaniem danych. Zazwyczaj są one wykorzystywane
jedynie w bieżącej działalności instytucji je gromadzących; analiza i interpretacja
danych może jednak dostarczyć istotnej wiedzy na temat reguł i zależności
rządzących procesami biznesowymi, zachowaniami konsumentów i zagrożeniami
funkcjonowania firmy.
Eksploracja danych to nowa dziedzina informatyki odpowiadająca na potrzebę zaawansowanej
i automatycznej analizy informacji. Jej dynamiczny rozwój wynika z konieczności
integracji istniejących algorytmów w celu efektywnego przetwarzania dużej ilości
nowych typów danych. Obecnie, wraz z rozwojem narzędzi do generowania i przechowywania
danych, eksploracji poddawane są coraz bardziej złożone informacje: multimedialne
(zdjęcia, filmy, muzyka), przestrzenne (mapy), przebiegi czasowe, struktury chemiczne
(sekwencje DNA), sieci społecznościowe.
Niniejsza książka jest pierwszym na polskim rynku samodzielnym podręcznikiem
przedstawiającym metody eksploracji danych w ujęciu algorytmicznym, a nie statystycznym.
Zawiera omówienie podstawowych metod eksploracji, min. odkrywanie asocjacji, wzorców
sekwencji, klasyfikację i grupowanie.
Dla każdej z metod omówiono podstawowe algorytmy eksploracji ilustrowane licznymi
przykładami. Dodatkowo, w celu sprawdzenia wiedzy czytelnika, przygotowano zestaw zadań
i ćwiczeń do samodzielnego wykonania.
Głównymi adresatami podręcznika są studenci informatyki, ekonomii, psychologii,
socjologii – dziedzin, w których duże znaczenie ma przetwarzanie informacji. Z
pewnością skorzystają z niego również doktoranci zajmujący się zagadnieniami
eksploracji danych i odkrywania wiedzy.
Przedmowa
Rozdział 1. Wprowadzenie
Rozdział 2. Odkrywanie asocjacji
2.1. Klasyfikacja reguł asocjacyjnych
2.2. Odkrywanie jednopoziomowych, jednowymiarowych, binarnych reguł asocjacyjnych:
sformułowanie problemu
2.3. Odkrywanie binarnych reguł asocjacyjnych: alternatywne sformułowanie problemu
2.4. Podstawowy algorytm odkrywania jednowymiarowych, jednopoziomowych, binarnych reguł
asocjacyjnych
2.5. Odkrywanie domkniętych i maksymalnych zbiorów częstych
2.6. Odkrywanie wielopoziomowych jednowymiarowych reguł asocjacyjnych
2.7. Odkrywanie wielowymiarowych reguł asocjacyjnych
2.8. Negatywne asocjacje
2.9. Miary atrakcyjności reguł asocjacyjnych
2.10. Zadania
2.11. Uwagi bibliograficzne
Rozdział 3. Odkrywanie wzorców sekwencji
3.1. Odkrywanie wzorców sekwencji: sformułowanie problemu
3.2. Podstawowy algorytm odkrywania wzorców sekwencji
3.3. Prefiksowy algorytm odkrywania wzorców sekwencji
3.4. Odkrywanie domkniętych wzorców sekwencji
3.5. Odkrywanie wzorców sekwencji z ograniczeniami czasowymi: sformułowanie problemu
3.6. Algorytm odkrywania wzorców sekwencji z ograniczeniami czasowymi
3.7. Odkrywanie uogólnionych wzorców sekwencji
3.8. Odkrywanie innych wzorców sekwencji
3.9. Zadania
3.10. Uwagi bibliograficzne
Rozdział 4. Klasyfikacja
4.1. Wprowadzenie do klasyfikacji
4.2. Klasyfikacja przez indukcję drzew decyzyjnych
4.3. Klasyfikatory regułowe
4.4. Klasyfikacja asocjacyjna
4.5. Klasyfikatory bayesowskie
4.6. Klasyfikator najbliższego sąsiedztwa
4.7. Kombinacja klasyfikatorów
4.8. Ocena jakości klasyfikatora
4.9. Zadania
4.10. Uwagi bibliograficzne
Rozdział 5. Grupowanie
5.1. Proces grupowania
5.2. Niepodobieństwo obiektów
5.3. Algorytmy grupowania
5.4. Grupowanie hierarchiczne
5.5. Grupowanie iteracyjno-optymalizacyjne
5.6. Metody grupowania gęstościowego
5.7. Metody grupowania gridowego
5.8. Metody oparte na modelu
5.9. Grupowanie obiektów opisanych zbiorami atrybutów kategorycznych
5.10. Wykrywanie punktów osobliwych
5.11. Zadania
5.12. Uwagi bibliograficzne
A. Dekompozycja SVD
B. Miary atrakcyjności reguł
Bibliografia
Skorowidz
564 stron, Format: 16.8x23.8cm, oprawa miękka