Вовед во рударење на масивни податоци

Вовед во рударење на масивни податоци

1.

Наслов на наставниот предмет

Вовед во рударење на масивни податоци

Introduction to mining massive dataset

2.

Код

F23L3W154

3.

Студиска програма

Софтверско инженерство и информациски системи, Компјутерски науки, Компјутерско инженерство, Интернет, мрежи и безбедност, Software engineering and information systems, Примена на информациски технологии, Софтверско инженерство и информациски системи, Компјутерски науки, Компјутерско инженерство, Интернет, мрежи и безбедност, Информатичка едукација, Software engineering and information systems, Примена на информациски технологии, Стручни студии за програмирање, Стручни студии за програмирање, Биоинформатика, Софтверско инженерство,

4.

Организатор на студиската програма (единица, односно институт, катедра, оддел)

Факултет за информатички науки и компјутерско инженерство

5.

Степен (прв, втор, трет циклус)

Прв циклус

6.

Академска година / семестар

4 / Зимски

7. Број на ЕКТС кредити

6.0

8.

Наставник

ворн. проф. д-р Ефтим Здравевски проф. д-р Ѓорѓи Маџаров

9.

Предуслови за запишување на предметот

Алгоритми и податочни структури или Примена на алгоритми и податочни структури

10.

Цели на предметната програма (компетенции):


Студентите да се запознаат со алгоритмите и техниките на податочно рударење и машинско учење за анализа на големи податочни множества. Фокус ќе биде даден на дистрибуираните платформи како и на начинот на дефинирање и креирање на алгоритми за процесирање и анализа на многу големи податочни множества.

11.

Содржина на предметната програма:


Предавања: 1. Вовед во MapReduce 2. Фреквентни множества и асоцијативни правила 3. Барање на најблиски соседи во многу-димензионални податоци, локациски сензитивни хеширања 4. Намалување на димензионалноста (SVD и CUR) 5. Системи на препораки базирани на колаборативно филтрирање 6. Системи на препораки базирани на содржина и хибридни системи за препораки 7. Кластерирање на масивни податочни множества 8. Надгледувано учење кај масивни податочни множества (К-најблиски соседи, апроксимативен К-најблиски соседи) 9. Надгледувано учење кај масивни податочни множества (класификациски и регресиски дрвa) 10. Надгледувано учење кај масивни податочни множества (длабоки невронски мрежи) 11. Континуирана обработка на масивни податоци базирано на прозорец 12. Рударење на податоци репрезентирани со графови Вежби: 1. Примери на MapReduce 2. Градење на асоцијативни правила 3. Употреба на локациски сензитивни хеширања и барање на најблиски соседи во многу-димензионални податоци 4. Употреба на SVD и CUR 5. Работа со алгоритми за препораки базирани на колаборативно филтрирање 6. Работа со алгоритми за препораки базирани на содржина и колаборативно филтрирање 7. Употреба на методи за кластерирање на масивни податочни множества 8. Употреба на методите К-најблиски соседи на реални проблеми 9. Работа со класификациски и регресиски дрвa 10. Работа со длабоки невронски мрежи за анализа на масивни податочни множества (само-надгледувано учење) 11. Работа со алгоритми за континуирана обработка на масивни податоци базирано на прозорец 12. Работа со граф невронски мрежи

12.

Методи на учење:


Предавања со користење на презентации, интерактивни предавања, вежби (користење на опрема и софтверски пакети), тимска работа, пример случаи, поканети гости предавачи, самостојна изработка и одбрана на проектна задача и семинарска работа.

13.

Вкупен расположив фонд на време

6.0 ЕКТС x 30 часа = 180 часа

14.

Распределба на расположивото време

30 + 45 + 0 + 30 + 75 = 180 часа

15.

Форми на наставните активности

15.1.

Предавања- теоретска настава

30 часови

15.2.

Вежби (лабораториски, аудиториски), семинари, тимска работа

45 часови

16.

Други форми на активности

16.1.

Проектни задачи

30 часови

16.2.

Самостојни задачи

0 часови

16.3.

Домашно учење

75 часови

17.

Начин на оценување

17.1.

Тестови

0 бодови

17.2.

Семинарска работа/ проект ( презентација: писмена и усна)

30 бодови

17.3.

Активности и учење

0 бодови

17.4.

Завршен испит

60 бодови

18.

Критериуми за оценување (бодови/ оценка)

до 50 бода

5 (пет) (F)

од 51 до 60 бода

6 (шест) (E)

од 61 до 70 бода

7 (седум) (D)

од 71 до 80 бода

8 (осум) (C)

од 81 до 90 бода

9 (девет) (B)

од 91 до 100 бода

10 (десет) (A)

19.

Услов за потпис и полагање на завршен испит

реализирани активности

20.

Јазик на кој се изведува наставата

македонски и англиски

21.

Метод на следење на квалитетот на наставата

механизам на интерна евалуација и анкети

22.

Литература

22.1.

Задолжителна литература

Ред.бр.

Автор

Наслов

Издавач

Година

8518

Jure Leskovec, Anand Rajaraman, Jeffrey D. Ullman

Mining of Massive Datasets

Cambridge University Press

2020

8519

Avrim Blum, John Hopcroft, and Ravindran Kannan

Foundations of Data Science

Draft version

2017

8520

Jiawei Han,‎ Micheline Kamber,‎ and Jian Pei

Data Mining: Concepts and Techniques, Third Edition

Morgan Kaufmann

2011

8521

0

22.2.

Дополнителна литература

Ред.бр.

Автор

Наслов

Издавач

Година