Normalize z opcją transformacji Z-transform). Zaaplikuj do zbioru danych operator Principal Component Analysis i postaraj się zachować 95% oryginalnej wariancji zbioru danych. Do ilu cech udało się ograniczyć zbiór danych? Czy potrafisz zinterpretować uzyskane cechy? Principal Component Analysis na operator Singular Value Decomposition. Obejrzyj uzyskany wynik. Czym różni się ten wynik od modelu PCA?Read CSV do wczytania zbioru danych autos.csv. Wskaż atrybut BODY_STYLE jako zmienną celu. Wykorzystaj któryś z algorytmów ekstrakcji cech do zmniejszenia liczby cech do 3. Dokonaj wizualizacji uzyskanych wyników. Czy możesz rozpoznać w nowej przestrzeni atrybutów poszczególne typy samochodów?Celem zadanie jest przetworzenie zbioru danych cukrzyca.csv. Zbiór posiada następujące atrybuty:
PREGNACIES: liczba wcześniejszych ciążGLUCOSE: koncentracja glukozy w 2 godziny po doustnym podaniu próbki testowejBLOOD_PRESSURE: ciśnienie krwi (mm Hg)SKIN_THICKNESS: grubość fałdu skóry na tricepsie (mm)INSULIN: poziom serum insuliny (mu U/ml)BMI: body mass index (waga w kg podzielona przez (wysokość w m2)DIABETES_PEDIGREE: funkcja występowania cukrzycy w rodzinieAGE: wiekCLASS: atrybut decyzyjny wskazujący na obecność/brak cukrzycyPostaraj się zastąpić zbiór oryginalnych atrybutów przez mniejszy zbiór cech. Sprawdź, do jakiego stopnia zmniejszenie liczby atrybutów wpływa na dokładność klasyfikacji. Wykonaj ćwiczenie wg poniższego wzorca:
UWAGA
*.csv nie ma zdefiniowanych atrybutów, musisz dodać je samodzielnie przed przystąpieniem do analizyCLASSRozwiązania proszę wysłać na adres Mikolaj.Morzy@put.poznan.pl w postaci pliku *.pdf zawierającego:
Rozwiązania przyjmuję do piątku, 19 czerwca 2020 r., do godziny 21:00.