Celem zadanie jest przetworzenie zbioru danych cukrzyca.csv. Zbiór posiada następujące atrybuty:
PREGNACIES
: liczba wcześniejszych ciążGLUCOSE
: koncentracja glukozy w 2 godziny po doustnym podaniu próbki testowejBLOOD_PRESSURE
: ciśnienie krwi (mm Hg)SKIN_THICKNESS
: grubość fałdu skóry na tricepsie (mm)INSULIN
: poziom serum insuliny (mu U/ml)BMI
: body mass index (waga w kg podzielona przez (wysokość w m2)DIABETES_PEDIGREE
: funkcja występowania cukrzycy w rodzinieAGE
: wiekCLASS
: atrybut decyzyjny wskazujący na obecność/brak cukrzycyPostaraj się zastąpić zbiór oryginalnych atrybutów przez mniejszy zbiór cech. Sprawdź, do jakiego stopnia zmniejszenie liczby atrybutów wpływa na dokładność klasyfikacji. Wykonaj ćwiczenie wg poniższego wzorca:
DIABETES
, zanotuj dokładność klasyfikatoraDIABETES
(możesz wykorzystać PCA, SVD, NNMF)DIABETES
, aby przetransformować dane do nowej przestrzeni zdefiniowanej przez odkryte cechyUWAGA
*.csv
nie ma zdefiniowanych atrybutów, musisz dodać je samodzielnie przed przystąpieniem do analizyCLASS