Orange Data Mining

Celem laboratorium jest zapoznanie studentów ze środowiskiem Orange Data Mining. W ramach ćwiczenia prezentowany jest interfejs narzędzia, możliwości wizualizacji zbiorów danych, algorytmy do odkrywanai asocjacji, klasyfikatory, algorytmy uczenia nienadzorowanego, a także możliwość pisania własnych skryptów.

  • Uruchom program Orange Canvas
  • Wykorzystaj operator Paint Data do przygotowania przykładowego zbioru danych.
  • Otwórz w narzędziu Orange plik iris.tab i zapoznaj się z możliwościami wizualizacji danych oferowanymi przez Orange Data Mining: wyświetl zawartość pliku za pomocą operatora Data Table, a następnie przetestuj możliwości następujących operatorów:
    • Distributions
    • Box Plot
    • Scatter Plot
    • Heat Map
    • Linear Projections
    • Mosaic Display.
  • Przy użyciu operatora Data Sampler wybierz 10% danych i wyślij je do operatora Discretize, przetestuj poszczególne schematy dyskretyzacji.
  • Sprawdź działanie operatora Outliers, przy czym do tego celu wykorzystaj dane niewybrane przez Data Sampler.
  • Skorzystaj z operatora Feature Construction do skonstruowania dwóch dodatkowych atrybutów, reprezentujących stosunek wysokości do szerokości płatków i słupków. Następnie przejdź do zakładki Unsupervised i skorzystaj z operatora Example Distance do skonstruowania macierzy odległości między obiektami. Wyświetl macierz odległości i wyślij ją do operatora Hierarchical Clustering w celu zbudowania dendrogramu obiektów.
  • Powtórz konstrukcję dendrogramu obiektów dla oryginalnego zbioru atrybutów

Python

 
sum-data.preprocessing.orange.txt · Last modified: 2019/03/22 21:33 by Mikołaj Morzy
 
Except where otherwise noted, content on this wiki is licensed under the following license:Public Domain
Recent changes RSS feed Donate Powered by PHP Valid XHTML 1.0 Valid CSS Debian Driven by DokuWiki