Normalize
z opcją transformacji Z-transform
). Zaaplikuj do zbioru danych operator Principal Component Analysis
i postaraj się zachować 95% oryginalnej wariancji zbioru danych. Do ilu cech udało się ograniczyć zbiór danych? Czy potrafisz zinterpretować uzyskane cechy? Principal Component Analysis
na operator Singular Value Decomposition
. Obejrzyj uzyskany wynik. Czym różni się ten wynik od modelu PCA?Read CSV
do wczytania zbioru danych autos.csv. Wskaż atrybut BODY_STYLE
jako zmienną celu. Wykorzystaj któryś z algorytmów ekstrakcji cech do zmniejszenia liczby cech do 3. Dokonaj wizualizacji uzyskanych wyników. Czy możesz rozpoznać w nowej przestrzeni atrybutów poszczególne typy samochodów?Celem zadanie jest przetworzenie zbioru danych cukrzyca.csv. Zbiór posiada następujące atrybuty:
PREGNACIES
: liczba wcześniejszych ciążGLUCOSE
: koncentracja glukozy w 2 godziny po doustnym podaniu próbki testowejBLOOD_PRESSURE
: ciśnienie krwi (mm Hg)SKIN_THICKNESS
: grubość fałdu skóry na tricepsie (mm)INSULIN
: poziom serum insuliny (mu U/ml)BMI
: body mass index (waga w kg podzielona przez (wysokość w m2)DIABETES_PEDIGREE
: funkcja występowania cukrzycy w rodzinieAGE
: wiekCLASS
: atrybut decyzyjny wskazujący na obecność/brak cukrzycyPostaraj się zastąpić zbiór oryginalnych atrybutów przez mniejszy zbiór cech. Sprawdź, do jakiego stopnia zmniejszenie liczby atrybutów wpływa na dokładność klasyfikacji. Wykonaj ćwiczenie wg poniższego wzorca:
UWAGA
*.csv
nie ma zdefiniowanych atrybutów, musisz dodać je samodzielnie przed przystąpieniem do analizyCLASS
Rozwiązania proszę wysłać na adres Mikolaj.Morzy@put.poznan.pl w postaci pliku *.pdf zawierającego:
Rozwiązania przyjmuję do piątku, 19 czerwca 2020 r., do godziny 21:00.