Концепти и примена на големи податоци

Концепти и примена на големи податоци

1.

Наслов на наставниот предмет

Концепти и примена на големи податоци

Concepts and applications of big data

2.

Код

m23_w_039

3.

Студиска програма

Управување во информатички технологии, Биоинформатика, Безбедност, криптографија и кодирање, Едукација со ИКТ, Еко-информатика, Интелигентни системи, Интернет технологии и сајбер безбедност, Компјутерски науки, Статистика и аналитика на податоци, Софтвер за вградливи системи, Софтверско инженерство, Управување во информатички технологии, Биоинформатика, Безбедност, криптографија и кодирање, Статистика и аналитика на податоци, Софтверско инженерство, Пресметување во облак, Data science in computer science and engineering, Пресметување во облак,

4.

Организатор на студиската програма (единица, односно институт, катедра, оддел)

Факултет за информатички науки и компјутерско инженерство

5.

Степен (прв, втор, трет циклус)

Втор циклус

6.

Академска година / семестар

5 / Зимски

7. Број на ЕКТС кредити

6.0

8.

Наставник

ворн. проф. д-р Ефтим Здравевски проф. д-р Горан Велинов

9.

Предуслови за запишување на предметот

10.

Цели на предметната програма (компетенции):


Целта на предметот е студентите да се запознаат со феноменот на големи податоци - причините за нивната појава и начините на нивно создавање, како и со теоретските и практичните концепти за моделирање и анализа на податоци со голем обем, брзина и разновидност. Ќе биде даден вовед во традиционалните системи за aнализа на податоци и предизвиците поврзани со големите податоци. Ќе бидат разгледани типични проблеми, апликации и системи поврзани со големи податоци. Од теоретски и практичен аспкет ќе биде проучен екоситемот изграден околу рамката Hadoop - намената, концептите и архитектурата на елементите на Hadoop и основните компоненти на екосистемот.

11.

Содржина на предметната програма:


Генерирање на големи податоци. Реални примери со трите типови на извори на големи податоци: луѓе, организации и сензори. Препознавање и опис на карактеристиките на големи податоци: волумен, брзина, променливост, разновидност, вредност, визуализација, валентност. Нивно влијание на собирањето, мониторингот, чувањето, анализата и генерирање извештаи. Постапка за добивање вредност од големи податоци преку процес за структурирана анализа. Предизвици и грешки во собирањето и анализата на големи податоци. Опис на архитектурните компоненти на системите кои се користат за скалабилна анализа на големи податоци. Податочно-водени стратегии за донесување одлуки. Хоризонтално и вертикално партиционирање на податоците. Предизвици со димензионално моделирање. Модули на Hadoop рамката: Common, YARN, HDFS, MapReduce. Основни компоненти на Hadoop екосистемот: HBase, Spark, Hive, Pig. Алатки за визуализација на големи податоци.

12.

Методи на учење:


Предавања поддржани со презентации преку слајдови, интерактивни предавања, вежби (користење на опрема и софтверски пакети), тимска работа, пример случаи, поканети гости предавачи, самостојна изработка и одбрана на проектна задача и семинарска работа, учење во електронско опкружување (форуми, консултации).

13.

Вкупен расположив фонд на време

6.0 ЕКТС x 30 часа = 180 часа

14.

Распределба на расположивото време

30 + 30 + 30 + 45 + 45 = 180 часа

15.

Форми на наставните активности

15.1.

Предавања- теоретска настава

30 часови

15.2.

Вежби (лабораториски, аудиториски), семинари, тимска работа

30 часови

16.

Други форми на активности

16.1.

Проектни задачи

45 часови

16.2.

Самостојни задачи

30 часови

16.3.

Домашно учење

45 часови

17.

Начин на оценување

17.1.

Тестови

30 бодови

17.2.

Семинарска работа/ проект ( презентација: писмена и усна)

45 бодови

17.3.

Активности и учење

20 бодови

17.4.

Завршен испит

0 бодови

18.

Критериуми за оценување (бодови/ оценка)

до 50 бода

5 (пет) (F)

од 51 до 60 бода

6 (шест) (E)

од 61 до 70 бода

7 (седум) (D)

од 71 до 80 бода

8 (осум) (C)

од 81 до 90 бода

9 (девет) (B)

од 91 до 100 бода

10 (десет) (A)

19.

Услов за потпис и полагање на завршен испит

реализирани активности 15.1 и 15.2

20.

Јазик на кој се изведува наставата

македонски и англиски

21.

Метод на следење на квалитетот на наставата

механизам на интерна евалуација и анкети

22.

Литература

22.1.

Задолжителна литература

Ред.бр.

Автор

Наслов

Издавач

Година

6502

Thomas Erl, Wajid Khattak, Paul Buhler

Big Data Fundamentals: Concepts, Drivers & Techniques

Prentice Hall

2016

6503

Yu, Shui, Guo, Song

Big Data Concepts, Theories, and Applications

Springer

2016

6504

Sourav Mazumder,‎ Robin Singh Bhadoria,‎ Ganesh Chandra Deka

Distributed Computing in Big Data Analytics: Concepts, Technologies and Applications

Springer

2017

6505

Martin Atzmueller, Samia Oussena, Thomas Roth-Berghofer

Enterprise Big Data Engineering, Analytics, and Management

IGI Global

2016

22.2.

Дополнителна литература

Ред.бр.

Автор

Наслов

Издавач

Година