強化学習
DQNとはなんなのだ〜DQNとはDeep Q-Networkの略で、Q学習を元にした学習手法であり、テレビゲームの学習に使われたりします。 ちなみにQ学習は、最適行動価値関数を決定しますがその近似のためにCNN(Convolutional Neural Network)を用いるものです。DQNのす…
Bootstrappingとは、推定をもとに推定をすること!参考: https://datascience.stackexchange.com/questions/30714/what-is-the-difference-between-bootstrapping-and-sampling-in-reinforcement-learn#targetText=Bootstrapping%3A%20When%20you%20estimat…