Indexing, deployment and searching algorithms in large databases
Autor práce: Ing. Veronika ŠalgováŠkoliteľ: doc. Ing. Michal Kvet, PhD.
Dátum obhajoby: 23.8.2022
Študijný program: aplikovaná informatika
Oponent 1: prof. Ing. Marcel Harakaľ, PhD.
Oponent 2: doc. Ing. Wiliam Steingartner, PhD.
Slovenský abstrakt:
ŠALGOVÁ, Veronika: Algoritmy indexovania, rozmiestňovania a vyhľadávania
v rozsiahlych databázach [dizertačná práca] – Žilinská univerzita v Žilina. Fakulta riadenia
a informatiky; Katedra informatiky. – Školiteľ: doc. Ing. Michal Kvet, PhD. – Stupeň
odbornej kvalifikácie: Doktor filozofie v študijnom odbore Informatika. Žilina: FRI ŽU v
Žiline, 2022.
Dizertačná práca sa zaoberá problematikou indexovania, rozmiestňovania a
vyhľadávania v rozsiahlych databázach. Množstvo dát v dnešnej dobe rapídne rastie, čo
prináša značné výzvy. Úložný priestor sa stáva dôležitým ukazovateľom nákladov. Veľký
dôraz sa kladie na zrýchľovanie prístupu k dátam. Výkon sa často zlepšuje pomocou
indexovania, vytvárania partícií, kompresie údajov v tabuľkách alebo indexoch alebo vhodnej
správy úložného priestoru. V našej dizertačnej práci sme sa zaoberali metódami prístupu k
indexom, procesom prístupu k dátam, ich optimalizáciou a naším prístupom k odstráneniu
potreby prehľadávania celej tabuľky metódou Table Access Full. Štrukturálny index označený
ako master sa používa na prístup k záznamu a jeho lokalizáciu s dôrazom na možnosti
fragmentácie. Zamerali sme sa aj na znižovanie času prístupu k dátam prostredníctvom
rôznych techník vytvárania partícií a indexovania a ich kombinácií, čo prinieslo výrazné
zmeny vo výkonnosti. Vplyv použitých metód a techník bol skúmaný na základe času
prístupu k údajom, nákladov na CPU a času vykonávania jednotlivých operácií, akými sú
Insert, Update a Delete. Zamerali sme sa aj na vplyv kompresie údajov v tabuľkách, indexoch
a ich kombináciách, ktorý bol určovaný na základe času prístupu k údajom a nákladov na
CPU. Zaoberali sme sa taktiež automatickým vyvažovaním indexov, kontrolou
nedefinovaných hodnôt, identifikáciou migrovaných riadkov a vyhodnotením vhodnosti
použitých indexov.
Kľúčové slová: Databázový systém. Indexové štruktúry. Vytváranie partícií. Kompresia dát.
Vyvažovanie indexov.
Anglický abstrakt:
ŠALGOVÁ, Veronika: Indexing, Deployment and Searching Algorithms in Large
Databases [dissertation thesis] – University of Žilina. Faculty of Management Science and
Informatics; Department of Informatics. – Supervisor: doc. Ing. Michal Kvet, PhD. –
Qualification level: Philosophiae doctor in the study field Informatics. Žilina: FRI ŽU in
Žilina, 2022.
The dissertation thesis deals with the issue of indexing, deployment and searching in
large databases. The amount of stored data is growing rapidly, and it brings considerable
challenges. The enormous growth in the volume of data makes storage one of the biggest cost
elements. Great emphasis is placed on the improvement of fast access to data. Performance
improvements are often provided through the use of indexing, partitioning, compression of
data in tables or indexes, or appropriate storage management. In our dissertation thesis, we
dealt with index access methods, the process of the data access, its optimization, and our
approach to removing the need to search the entire table physically by using the Table Access
Full method. The structural index denoted as the master is used to access and locate a record
with an emphasis on fragmentation options. We also focused on reducing data access time
through various partitioning and indexing techniques and their combinations, which brought
significant changes in performance. The impact of the methods and techniques used was
researched on the basis of data access time, CPU costs, and execution time of individual
operations such as Insert, Update, and Delete. We also focused on the effect of data
compression in tables, indexes, and their combinations, which was determined based on data
access time and CPU costs. We dealt with automatic index balancing, control of undefined
values, migrated rows identification, and index structure efficiency evaluation.
Keywords: Database System. Index Structures. Partitioning. Data Compression. Index
balancing.
Autoreferát dizertačnej práce
Text práce