Prezentowana praca przedstawia zastosowanie metod Data Mining do analizy i
prognozowania kondycji ekonomicznej (finansowej i majątkowej)
przedsiębiorstw.
Metody Data Mining nie są jeszcze zbyt popularne i szeroko stosowane w Polsce. Zalicza
się do nich metody statystyczne i metody sztucznej inteligencji, które umożliwiają
odkrywanie nieznanych zależności między danymi w nagromadzonych zbiorach danych. Są to
takie metody, które pozwalają z danych tworzyć wiedzę (znajdywać zależności,
wzorce, trendy) . Rozwój metod Data Mining związany jest z rozwojem wielu dziedzin:
informatyki, statystyki, ekonometrii, matematycznych technik rozwiązywania problemów,
teorii i narzędzi wnioskowania w warunkach niepewności. W języku polskim metody Data
Mining nazywane są różnie: metodami eksploracji danych, odkrywania wiedzy w bazach
danych, zgłębiania danych, eksploatacji danych, drążenia danych, a nawet torturowania
danych. Jednak najczęściej używana jest nazwa angielska Data Mining, stąd też zwrot
ten zastosowano w tytule książki.
Książka nie jest podręcznikiem metod, ani tym bardziej wspomagających je
programów. Przeznaczona jest dla użytkowników, którzy chcieliby kompleksowo
wykorzystać je w jednym, wybranym zastosowaniu. W książce posłużono się przykładem
takiego zastosowania analizą i prognozowaniem kondycji ekonomicznej przedsiębiorstw. Z
wykorzystywanych metod należy wymienić m.in.: metodę regresji, sieci neuronowe
wielowarstwowe, drzewa decyzyjne, metodę k-średnich, sieci neuronowe Kohonena. Starano
się przedstawić ogólne zasady postępowania przy stosowaniu metod Data Mining, ale
także zwrócić uwagę na potrzebę ujęcia specyfiki problemu. Proponuje się
zastosowanie jednego programu Enterprise Miner firmy SAS, który jest rozbudowanym
programem eksploracji danych i okazał się w pełni wystarczający. W pracy nie
przedstawiano zbyt szczegółowo opisów obsługi (poszczególnych opcji) programu, ani
wersji poszczególnych metod.
Spis treści:
Wprowadzenie
1. Wstępna analiza danych i przygotowanie danych do analizy Data Mining
2. Budowa modeli analizy i prognozowania przedsiębiorstw
2.1. Budowa i wykorzystywanie modeli regresji
2.2. Budowa i zastosowanie sieci neuronowych
2.3. Modele drzew decyzyjnych w analizach kondycji przedsiębiorstw
3. Sporządzanie prognoz - generowanie i wykorzystywanie kodu skoringowego
3.1. Modele regresji, sieci neuronowych oraz drzew decyzyjnych jako narzędzia
prognozowania
3.2. Porównanie wyników prognozowania uzyskanych za pomocą różnych modeli
3.3. Kryteria oceny modeli prognozowania a analiza wyników prognoz
4. Zastosowanie metod grupowania danych
4.1. Tworzenie skupień przedsiębiorstw za pomocą metody k-średnich
4.2. Wykorzystanie sieci neuronowych Kohonena w grupowaniu przedsiębiorstw
5. Dylematy i problemy analizowania i prognozowania kondycji ekonomicznej
przedsiębiorstw za pomocą metod Data Mining
5.1. Problemy doboru zmiennych na potrzeby prognozowania i grupowania przedsiębiorstw
5.2. Uwzględnianie wpływu interakcji między zmiennymi objaśniającymi - wprowadzanie
czynników interakcji do modeli
5.3. Potrzeby i metody przeprowadzania transformacji zmiennych
5.4. Postępowanie w przypadku brakujących wartości. Wybór metod imputacji
5.5. Analiza i eliminacja wpływu obserwacji nietypowych (outliers) na wyniki
Bibliografia
Załączniki
Załącznik 1. Analizowane przedsiębiorstwa i ich przynależność do sektorów
gospodarki
Załącznik 2. Wykorzystywane dane finansowe i wskaźniki finansowe
Załącznik 3. Przykład raportu z realizacji projektu analizy i prognozowania kondycji
ekonomicznej przedsiębiorstw (fragment)
174 strony, B5, miękka oprawa