Zadanie zaliczeniowe : ekstrakcja cech

Celem zadanie jest przetworzenie zbioru danych cukrzyca.csv. Zbiór posiada następujące atrybuty:

Postaraj się zastąpić zbiór oryginalnych atrybutów przez mniejszy zbiór cech. Sprawdź, do jakiego stopnia zmniejszenie liczby atrybutów wpływa na dokładność klasyfikacji. Wykonaj ćwiczenie wg poniższego wzorca:

  1. zbuduj klasyfikator (np. drzewo decyzyjne) wykorzystujący oryginalną tabelę DIABETES, zanotuj dokładność klasyfikatora
  2. dokonaj ekstrakcji cech z tabeli DIABETES (możesz wykorzystać PCA, SVD, NNMF)
  3. zastosuj model ekstrakcji cech zbudowany w punkcie (2) do tabeli DIABETES, aby przetransformować dane do nowej przestrzeni zdefiniowanej przez odkryte cechy
  4. zbuduj klasyfikator (wykorzystaj ten sam algorytm co w punkcie (1)) działający na danych z punktu (3), porównaj uzyskaną dokładność klasyfikatora.

UWAGA