Обработка на текстуални податоци

Обработка на текстуални податоци

1.

Наслов на наставниот предмет

Обработка на текстуални податоци

Processing of textual data

2.

Код

m23_w_045

3.

Студиска програма

Пресметување во облак, Управување во информатички технологии, Биоинформатика, Безбедност, криптографија и кодирање, Едукација со ИКТ, Еко-информатика, Интелигентни системи, Интернет технологии и сајбер безбедност, Компјутерски науки, Статистика и аналитика на податоци, Софтвер за вградливи системи, Софтверско инженерство, Пресметување во облак, Управување во информатички технологии, Биоинформатика, Безбедност, криптографија и кодирање, Статистика и аналитика на податоци, Софтверско инженерство, Data science in computer science and engineering,

4.

Организатор на студиската програма (единица, односно институт, катедра, оддел)

Факултет за информатички науки и компјутерско инженерство

5.

Степен (прв, втор, трет циклус)

Втор циклус

6.

Академска година / семестар

5 / Зимски

7. Број на ЕКТС кредити

6.0

8.

Наставник

проф. д-р Катерина Здравкова

9.

Предуслови за запишување на предметот

10.

Цели на предметната програма (компетенции):


По успешното завршување на овој предмет, студентот ќе биде во состојба да ги препознае клучните проблеми што произлегуваат од користењето на текстуалните податоци, да ги запознае најсоодветните алгоритми за нивното разрешување, да ги истражи и анализира текстуалните податоци и од нив да открие ново знаење, да ги запознае и примени постоечките алатки за обработка на текстуалните податоци и да создаде сопствени решенија за реализација на одделни задачи од областа на обработката и рударството на текстуалните документи и податоци.

11.

Содржина на предметната програма:


Вовед во обработката на текстуалните податоци и текстуалното рударство;; Извлекување, класификација, категоризација и групирање на податоците;; Основни техники на текстуалното рударство;; Текстуалното рударство и машинското учење;; Примери на примена на техниките на текстуалното рударство во различни апликации;; Идните трендови на обработката на текстуалните податоци.

12.

Методи на учење:


предавања, проекти, дискусии, работилници

13.

Вкупен расположив фонд на време

6.0 ЕКТС x 30 часа = 180 часа

14.

Распределба на расположивото време

30 + 45 + 0 + 0 + 0 = 180 часа

15.

Форми на наставните активности

15.1.

Предавања- теоретска настава

30 часови

15.2.

Вежби (лабораториски, аудиториски), семинари, тимска работа

45 часови

16.

Други форми на активности

16.1.

Проектни задачи

0 часови

16.2.

Самостојни задачи

0 часови

16.3.

Домашно учење

0 часови

17.

Начин на оценување

17.1.

Тестови

0 бодови

17.2.

Семинарска работа/ проект ( презентација: писмена и усна)

0 бодови

17.3.

Активности и учење

0 бодови

17.4.

Завршен испит

0 бодови

18.

Критериуми за оценување (бодови/ оценка)

до 50 бода

5 (пет) (F)

од 51 до 60 бода

6 (шест) (E)

од 61 до 70 бода

7 (седум) (D)

од 71 до 80 бода

8 (осум) (C)

од 81 до 90 бода

9 (девет) (B)

од 91 до 100 бода

10 (десет) (A)

19.

Услов за потпис и полагање на завршен испит

Реализирани активности 15, 16

20.

Јазик на кој се изведува наставата

македонски или англиски

21.

Метод на следење на квалитетот на наставата

-

22.

Литература

22.1.

Задолжителна литература

Ред.бр.

Автор

Наслов

Издавач

Година

6581

Dipanjan Sarkar

Text Analytics with Python: A Practical Real-World Approach to Gaining Actionable Insights from your Data

Apress

2016

6582

Rob Miller

Text Processing with Ruby: Extract Value from the Data That Surrounds You

Pragmatic Bookshelf

2015

6583

Gabe Ignatow,‎ Rada F. Mihalcea

Text Mining: A Guidebook For The Social Sciences

SAGE Publications

2016

22.2.

Дополнителна литература

Ред.бр.

Автор

Наслов

Издавач

Година