Celem laboratorium jest zapoznanie studentów ze środowiskiem Orange Data Mining. W ramach ćwiczenia prezentowany jest interfejs narzędzia, możliwości wizualizacji zbiorów danych, algorytmy do odkrywanai asocjacji, klasyfikatory, algorytmy uczenia nienadzorowanego, a także możliwość pisania własnych skryptów.
Paint Data
do przygotowania przykładowego zbioru danych.iris.tab
i zapoznaj się z możliwościami wizualizacji danych oferowanymi przez Orange Data Mining: wyświetl zawartość pliku za pomocą operatora Data Table
, a następnie przetestuj możliwości następujących operatorów:Distributions
Box Plot
Scatter Plot
Heat Map
Linear Projections
Mosaic Display
.Data Sampler
wybierz 10% danych i wyślij je do operatora Discretize
, przetestuj poszczególne schematy dyskretyzacji. Outliers
, przy czym do tego celu wykorzystaj dane niewybrane przez Data Sampler
. Feature Construction
do skonstruowania dwóch dodatkowych atrybutów, reprezentujących stosunek wysokości do szerokości płatków i słupków. Następnie przejdź do zakładki Unsupervised i skorzystaj z operatora Example Distance
do skonstruowania macierzy odległości między obiektami. Wyświetl macierz odległości i wyślij ją do operatora Hierarchical Clustering
w celu zbudowania dendrogramu obiektów.