email: Mikolaj.Morzy@put.poznan.pl
Instytut Informatyki Politechniki Poznańskiej, ul. Piotrowo 2, 60-965 Poznań
Celem przedmiotu jest zapoznanie słuchaczy z dwoma istotnymi narzędziami współczesnej analityki biznesowej: eksploracją danych (ang. data mining) oraz analizą sieci społecznościowych (ang. social network analysis). W trakcie wykładów słuchacze poznają najbardziej fundamentalne metody eksploracji danych: odkrywanie asocjacji, klasyfikację i analizę skupień, a w trakcie laboratoriów uzupełniają wiedzę wyniesioną z wykładu przez ćwiczenia w różnych środowiskach do eksploracji danych. Główny nacisk położony jest na ćwiczenia praktyczne, słuchacze poznają istniejące narzędzia służące do eksploracji danych (Orange Data Mining, Weka, Rapid Miner. W obszarze analizy sieci społecznościowych słuchacze poznają podstawowe techniki analizy, miary oceny sieci, oraz badają modele ewolucji sieci. Przyglądamy się też bardzo szczegółowo prawom potęgowym, które stanowią szkielet większości współczesnych sieci społecznościowych. W trakcie laboratorium słuchacze ćwiczą analizę sieci przy użyciu kilku różnych narzędzi: Gephi, Pajeka, VisOne.
Program zajęć laboratoryjnych obejmuje następujące zagadnienia:
Poniżej można się zapoznać z aktualnym zestawieniem punktów. Zestawienie nie obejmuje jeszcze ocen za zadania praktyczne (laboratorium) oraz odpowiedzi w quizach.
Wykład i laboratorium są zaliczane na podstawie punktów. Punkty zdobywacie przez przygotowywanie notek na blogu, obecności, udział w quizach i realizację zadań laboratoryjnych. W zależności od uzyskanej liczby punktów otrzymujecie następujące oceny:
punkty | ocena |
---|---|
powyżej | bardzo dobry |
75-79 | dobry plus |
65-74 | dobry |
60-64 | dostateczny plus |
50-59 | dostateczny |
poniżej | niedostateczny |
Punkty można uzyskać za:
w trakcie semestru można przygotować tylko jedną notkę blogową. Notki należy przygotować w serwisie tsiss.wordpress.com/, dane do logowania można uzyskać pisząc bezpośrednio do Mikolaj.Morzy@put.poznan.pl
Jednym ze sposobów zdobycia punktów jest przygotowanie wpisu na TSiSS@PUT: blogu związanym z przedmiotem. Wpis może dotyczyć dowolnego zagadnienia (technologia, program, artykuł naukowy, algorytm, itp.) związanego z przedmiotem (można wzorować się na ubiegłorocznych wpisach, ale oczywiście nie można ich powtarzać). Wpis może dotyczyć też dwóch artykułów naukowych związanych z przedmiotem, przy czym jeden artykuł otrzymacie Państwo ode mnie, a drugi (związany tematycznie z pierwszym), musicie Państwo odnaleźć samodzielnie. W notce blogowej należy zamieścić pełny odnośnik bibliograficzny do recenzowanych artykułów, opis zawartości artykułu oraz koniecznie swoje własne przemyślenia na temat przeczytanej pracy. Lista artykułów które mogą stać się inspiracją do notki znajduje się na stronie www.citeulike.org/user/mmorzy/tag/tsiss Dodatkowe artykuły można z łatwością znaleźć korzystając z serwisów Google Scholar lub CiteseerX.
UWAGA : absolutnie fantastyczna kolekcja 27 darmowych książek z obszaru eksploracji danych, uczenia maszynowego i predictive analytics : http://www.dataonfocus.com/21-free-data-mining-books/
UWAGA: termin nadsyłania odpowiedzi w quizach upływa w niedzielę, 5 lipca, o godzinie 23:59.
10.05.2015 Spotkanie 1
23.05.2015 Spotkanie 2
20.06.2015 Spotkanie 3
27.06.2015 Spotkanie 4
W trakcie laboratoriów będą wykorzystywane następujące programy:
10.05.2015 Spotkanie 1
23.05.2015 Spotkanie 2
21.06.2015 Spotkanie 3
27.06.2015 Spotkanie 4
Odpowiedzi na zadania prześlij w formie jednego pliku *.pdf
na adres Mikolaj.Morzy@put.poznan.pl. W raporcie możesz umieścić krótki opis wykonanych kroków i zrzuty ekranów.
Blue, Gold, White, Black, Orange, Circles, Crosses, Text, Crescent, Red, Green, Animate
. Jako zmienną celu wskaż atrybut Landmass
. W celu wyboru atrybutów wykorzystaj operator Select Attributes
. Następnie zbuduj zbiór reguł asocjacyjnych zaznaczając opcję Induce classification rules. W odpowiedzi podaj po jednej regule o najwyższej ufności opisującej każdy kontynent.