Celem zadanie jest przetworzenie zbioru danych cukrzyca.csv. Zbiór posiada następujące atrybuty:
PREGNACIES: liczba wcześniejszych ciążGLUCOSE: koncentracja glukozy w 2 godziny po doustnym podaniu próbki testowejBLOOD_PRESSURE: ciśnienie krwi (mm Hg)SKIN_THICKNESS: grubość fałdu skóry na tricepsie (mm)INSULIN: poziom serum insuliny (mu U/ml)BMI: body mass index (waga w kg podzielona przez (wysokość w m2)DIABETES_PEDIGREE: funkcja występowania cukrzycy w rodzinieAGE: wiekCLASS: atrybut decyzyjny wskazujący na obecność/brak cukrzycyPostaraj się zastąpić zbiór oryginalnych atrybutów przez mniejszy zbiór cech. Sprawdź, do jakiego stopnia zmniejszenie liczby atrybutów wpływa na dokładność klasyfikacji. Wykonaj ćwiczenie wg poniższego wzorca:
DIABETES, zanotuj dokładność klasyfikatoraDIABETES (możesz wykorzystać PCA, SVD, NNMF)DIABETES, aby przetransformować dane do nowej przestrzeni zdefiniowanej przez odkryte cechyUWAGA
*.csv nie ma zdefiniowanych atrybutów, musisz dodać je samodzielnie przed przystąpieniem do analizyCLASS