Dizertačné práce

Aproximácia funkcie ohodnotení v algoritmoch Q-learning neurónovou sieťou

Autor práce: Ing. Michal Chovanec
Školiteľ: prof. Ing. Juraj Miček, PhD.
Dátum obhajoby: 22.8.2016
Študijný program: 9.2.9 Aplikovaná informatika
Oponent 1: doc. RNDr. Katarína Bachratá, FRI, UNIZA
Oponent 2: prof. Ing. Karel Šotek, CSc., UP, Pardubice

Slovenský abstrakt:
MICHAL CHOVANEC: Aproximácia funkcie ohodnotení v algoritmoch Q-learning neurónovou siet’ou [Dizertačná práca] Žilinská univerzita v Žiline, Fakulta riadenia a informatiky, Katedra technickej kybernetiky. Vedúci: prof. Ing. Juraj Miček, PhD. FRI ŽU v Žiline, 2016 Práca sa zaoberá aproximáciou funkcie ohodnotení konania agenta, v algoritmoch Qlearning. V priestoroch s malým počtom stavov predstavuje vhodné riešenie tabul’ka. Pre prípady vel’kého počtu stavov je tabul’kové riešenie t’ažko vypočítatel’né. Je tak nutné použit’ aproximáciu. Vhodným kandidátom je neurónová siet’. Tradičné riešenie doprednej siete je však nepoužitel’né z dôvodov nemožnosti takúto siet’ uˇcit’. V práci je preto venovaný priestor neurónovej sieti bázických funkcií ktorú už je možné na daný problém trénovat’ iteračnými metódami.

Anglický abstrakt:
MICHAL CHOVANEC: Q-function aproximation in Q-learning algortihms using neural network [Disertation thesis] University of Žilina, Faculty of Management Science and Informatics, Department of technical cybernetics. Tutor: prof. Ing. Juraj Miˇcek, PhD FRI ŽU v Žiline, 2016 This thesis is focused on Q-value function approximation, in Q-learning algorithms. In state spaces with small numbers of states can be solution using table used well. In cases with large numbers of states is table solution difficult to solve. It is necessary to use approximation, where good candidate can be neural network. Common solution, using feed forward neural network can’t be used, because impossible to learn this network. Thesis is focused to use basis functions neural network, which can be learned using iterations methods.

Autoreferát dizertačnej práce
Text práce

0
študentov
0
učiteľov
0
partnerov

Partneri FRI

Platinový partner

Hlavný partner

Partneri

Projekty a centrá FRI

Projekty

Inteligentné operačné a spracovateľské systémy pre UAV
Transdata
IT akadémia
ACeSYRI
SmartSoc
TECH4EDU4
Centre in Advanced Biomedical and Medical Informatics

Centrá

Cisco Network Academy
PEARSON VUE - Aturizované centrum