# Wizualizacja tricku kernelowego

W pierwszym kroku generujemy dane które nie są separowalne w przestrzeni 2-D

In [None]:
from sklearn.datasets import make_circles

X, y = make_circles(n_samples=100, noise=0.05)

In [None]:
import numpy as np
from mpl_toolkits import mplot3d
import matplotlib.pyplot as plt
%matplotlib notebook


plt.scatter(X[:, 0], X[:, 1], c=y)

In [None]:
x1, x2 = X[:, 0], X[:, 1]

W następnym kroku posłużymy się trickiem kernelowym żeby przetransformować dane z przestrzeni 2-D (w której dane nie są liniowo separowalne) do przestrzeni 3-D, w której będą liniowo separowalne. Użyjemy następującego kernela (symbol $<>$ oznacza iloczyn skalarny wektorów): $$K(x,y)=^2$$ który przeprowadza następującą transformacją: 

$$<[x_1x_2],[y_1y_2]>^2=(x_1y_1 * x_2y_2)^2=x_1^2y_1^2 + 2x_1y_1x_2y_2 + x_2^2y_2^2 = x_1^2y_1^2 + \sqrt{2}x_1x_2\sqrt{2}y_1y_2 + x_2^2y_2^2 = <[x_1^2,\sqrt{2}x_1x_2,x_2^2],[y_1^2,\sqrt{2}y_1y_2,y_2^2]>$$

$$\phi([x_1,x_2]=[x_1^2, \sqrt{2}x_1x_2, x_2^2]$$

In [None]:
z1 = x1**2
z2 = np.sqrt(2)*x1*x2
z3 = x2**2

Z = np.column_stack((z1, z2, z3))

print(Z[:5])

Po transformacji dane są w sposób oczywisty separowalne w przestrzeni 3-D

In [None]:
plt.clf()
ax = plt.axes(projection='3d')
ax.scatter3D(z2, z3, z1, c=y);

### dla chętnych

Przeprowadź analogiczną wizualizację przy użyciu kernela $K(x,y)=(1+)^2$

# Klasyfikacja przy użyciu SVM

Do realizacji ćwiczenia posłużymy się klasą [sklearn.svm.SVM](https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html) i sprawdzimy wrażliwość algorytmu na poszczególne parametry.

In [None]:
from sklearn.datasets import load_wine
wines = load_wine()

print(wines['DESCR'])

In [None]:
X, y = wines['data'], wines['target']

In [None]:
%matplotlib inline

plt.hist(y)

In [None]:
from sklearn.pipeline import make_pipeline
from sklearn.model_selection import train_test_split
from sklearn.metrics import classification_report, confusion_matrix
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC

scaler = StandardScaler()

# https://scikit-learn.org/stable/modules/generated/sklearn.svm.SVC.html
svm = SVC(C=1e-2, kernel='poly', degree=2)

X = scaler.fit(X).transform(X)

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.5)

In [None]:
y_pred = svm.fit(X_train, y_train).predict(X_test)

In [None]:
print(f""" {

classification_report(y_pred, y_test)}

Confusion matrix:
{confusion_matrix(y_pred, y_test)} 

Number of support vectors per class: {svm.n_support_}

""")