WEKO3
アイテム
意思決定の階層化による強化学習の学習効率の向上
http://hdl.handle.net/10458/5899
http://hdl.handle.net/10458/5899e88b7665-7c04-471d-badd-da5b65d85eda
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | 紀要論文 / Departmental Bulletin Paper(1) | |||||
---|---|---|---|---|---|---|
公開日 | 2020-06-21 | |||||
タイトル | ||||||
タイトル | 意思決定の階層化による強化学習の学習効率の向上 | |||||
言語 | ja | |||||
タイトル | ||||||
タイトル | Accuracy Improvement for TSP by Multi-Level Perturbed Parallel Island Model | |||||
言語 | en | |||||
言語 | ||||||
言語 | jpn | |||||
キーワード | ||||||
言語 | en | |||||
主題Scheme | Other | |||||
主題 | Reinforcement Learning, Multi-layer decision making, Tracking problem | |||||
資源タイプ | ||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||
資源タイプ | departmental bulletin paper | |||||
著者 |
山森, 一人
× 山森, 一人× 渡部, 将人× 相川, 勝× Watanabe, Masato |
|||||
抄録 | ||||||
内容記述タイプ | Abstract | |||||
内容記述 | Tracking problem is one of the popular benchmark to evaluate reinforcement learning. In the tracking problem, some hunters trace a target and try to catch target in shorter steps. In the paper, we propose to separate decision marking process of reinforcement learning from two points of view; strategy decision and tactical decision. Strategy decision decides the movement policy of the hunters, and tactical decision decides the movement direction of each hunter. Experimental results showed that our method could catch the target with 54% steps by the conventional reinforcement learning. | |||||
言語 | en | |||||
書誌情報 |
ja : 宮崎大学工学部紀要 en : Memoirs of Faculty of Engineering, University of Miyazaki 巻 45, p. 221-225, 発行日 2016-07-29 |
|||||
出版者 | ||||||
出版者 | 宮崎大学工学部 | |||||
言語 | ja | |||||
出版者 | ||||||
出版者 | Faculty of Engineering, University of Miyazaki | |||||
言語 | en | |||||
ISSN | ||||||
収録物識別子タイプ | ISSN | |||||
収録物識別子 | 05404924 | |||||
書誌レコードID | ||||||
収録物識別子タイプ | NCID | |||||
収録物識別子 | AA00732558 | |||||
著者版フラグ | ||||||
出版タイプ | VoR | |||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 |