Celem laboratorium jest zapoznanie studentów z podstawowymi metodami indukcji drzew decyzyjnych. W trakcie laboratorium studenci wykonują ćwiczenia z użyciem Rapid Minera oraz budują klasyfikator bezpośrednio w bazie danych przy użyciu Orange Canvas.
Golf
i uruchomieniu operatora Decision Stump
. Obejrzyj uzyskany model. Sprawdź, w jaki sposób zmiana kryterium podziału zbioru wpływa na kształt modelu. Zamień operator Decision Stump
na operator Decision Tree
i ponownie zbuduj oraz przeanalizuj model. Następnie wyłącz pre- i post-processing i sprawdź, jaki wpływ miało to na kształt modeluDiscretize
, podział na 3 przedziały), oraz zmień operator Decision Tree
na kolejno: CHAID
, ID3
, oraz Decision Tree (weight-based)
. W ostatnim przypadku jako operator wewnętrzny do ważenia atrybutów wykorzystaj operator Weight by Correlation
.Read ARFF
(wczytaj plik mushroom.arff), Set Role
(wskaż atrybut class
jako typu label
), Replace Missing Values
(pozostaw domyślne parametry), oraz uruchom proces walidacji krzyżowej wykorzystując operator X-Validate
. Jako operatory wewnętrzne walidacji zastosuj najpierw Decision Tree
, a potem Random Forest
. Zaobserwuj zmiany w generowanych modelach, zwróć uwagę, jaki wpływ na model losowy ma zwiększenie puli dostępnych atrybutów.File
aby wczytać zawartość pliku adult.tab
Distributions
, Attribute Statistics
, Scatterplot
, Radviz
i Mosaic Display
w celu zapoznania się z możliwościami wizualizacji danych oferowanymi przez środowisko Orange CanvasData Sampler
wykonaj próbkowanie metodą bootstrap (losowanie z powtórzeniami). Classification tree
i prześlij do niego zbiór uczący.Classification Tree Viewer
i Classification Tree Graph
. Bez wątpienia model jest zbyt duży. Postaraj się tak dobrać parametry generowanego drzewa, aby model stał sie bardziej czytelny. Test Learners
i obejrzyj wyniki oceny drzewa decyzyjnego. Dodaj też operatory Confusion Matrix
i ROC Analysis
w celu przyjrzenia się dokładności modelu.Classification Tree
inne modele klasyfikacji, np. naiwny klasyfikator Bayesa lub losowe drzewo decyzyjne, a następnie zbadać wyniki ich działania.Select Attributes
do wskazania, który atrybut jest zmienną celu.