Dizertačné práce

Algoritmy pre identifikáciu plagiátov zdrojových kódov

Autor práce: Ing. Michal Ďuračík
Školiteľ: doc. Ing. Emil Kršák, PhD.
Dátum obhajoby: 20.8.2019
Študijný program: 9.2.9 Aplikovaná informatika
Oponent 1: prof. Ing. Karol Matiaško, PhD.
Oponent 2: doc. Ing. Jaroslav Porubän, PhD.

Slovenský abstrakt:
ĎURAČÍK, Michal: Algoritmy pre identifikáciu plagiátov zdrojových kódov. [Dizertačná práca] Žilinská univerzita v Žiline. Fakulta riadenia a informatiky. Katedra softvérových technológií. - Vedúci dizertačnej práce: doc. Ing. Emil Kršák, PhD. – Žilina: FRI ZU, 2019, 143 s. Táto dizertačná práca sa zaoberá problematikou plagiátorstva v zdrojovom kóde. Tejto oblasti sa v súčastnosti nevenuje až taká pozornosť, ako plagiátorstvu v textových prácach. V práci vychádzame zo skúsenosti s bojom voči plagiátorstvu na Fakulte riadenia a informaiky, Žilinskej univerzite v Žiline. Cieľom práce je návrh metódy, ktorá umožní vyhľadávanie plagiátov vo veľkom rozsahu, podobne, ako je to bežné pri textových dokumentoch. Pri návrhu tejto metódy využívame znalosti z oblasti vyhľadávania plagiátov v textových dokumentoch. Práca popisuje možnosti spracovania a reprezentácie zdrojového kódu. Na reprezentáciu zdrojového kódu využívame charakteristické vektory, ktoré následne organizujeme pomocou navrhnutej metódy inkrementálneho klasteringu. Na základe klasteringu vytvárame databázu zdrojového kódu, voči ktorej následne overujeme jednotlivé zdrojové kódy. Výsledkom navrhnutej a implementovanej metódy je systém, ktorý umožnuje vyhľadávanie plagiátov v zdrojovom kóde vo vačšom meradle, ako bolo so súčasnými nástrojmi možné. Práca sa okrem návrhu metódy venuje aj overovaniu jednotlivých jej fáz a porovnaniu dosiahnutých výsledkov s bežne, v tejto oblasti, používanými nástrojmi. Kľúčové slová: plagiátorstvo, zdrojový kód, detekcia plagiátorstva, charakteristické vektory

Anglický abstrakt:
ĎURAČÍK, Michal: Algorithms for source code plagiarism identification. [Dissertation thesis] - University of Žilina. Faculty of Management Science and Informatics. Department of Software Technology. - Supervisor: doc. Ing. Emil Kršák, PhD. - Žilina, FRI ZU, 2019, 143 p. This dissertation thesis deals with the issue of plagiarism in the source code. At the moment, this area is not given as much attention as looking for a plagiarism in a text works. The work is based on the experience with the fight against plagiarism at the Faculty of Management science and Informatics, University of Žilina. The aim of the thesis is to design a method, that allows for large-scale plagiarism searches, similar to methods used in the text documents. When designing this method, we use the knowledge of plagiarism in text documents. The work describes the possibilities of processing and representation of source code. We use characteristic vectors to represent the source code, which we then organize using the proposed incremental clustering method. Based on clustering, we create a source code database, against which we then verify individual source code fragments. The proposed and implemented method results in a system, that allows plagiarism to be searched in the source code on a larger scale, than was possible with current tools. In addition to the method design, the work also deals with the verification of its individual phases and the comparison of the achieved results with commonly used tools in this area. Key words: plagiarism, source code, plagiarism detection, characteristic vectors

Autoreferát dizertačnej práce
Text práce

0
študentov
0
učiteľov
0
partnerov

Partneri FRI

Platinový partner

Hlavný partner

Partneri

Projekty a centrá FRI

Projekty

Inteligentné operačné a spracovateľské systémy pre UAV
Transdata
IT akadémia
ACeSYRI
SmartSoc
TECH4EDU4
Centre in Advanced Biomedical and Medical Informatics

Centrá

Cisco Network Academy
PEARSON VUE - Aturizované centrum