#

bandit-algorithm

Here are 5 public repositories matching this topic...

raklokesh / ReinforcementLearning_Sutton-Barto_Solutions

Solutions and figures for problems from Reinforcement Learning: An Introduction Sutton&Barto

reinforcement-learning qlearning mountain-car sarsa gradient-descent feature-engineering bandit-algorithm sutton-gambler sutton-book dynaq sutton-gridworld blackjack-montecarlo batch-update maximization-bias infinite-variance rl-sutton semi-gradient-sarsa short-corridor optimal-policy

Updated Jul 16, 2019
Python

adik993 / reinforcement-learning-sutton

reinforcement-learning q-learning sarsa gridworld multi-armed-bandits random-walk racecar bandit-algorithm sutton-book td-lambda dyna-q cliffwalking

Updated Mar 4, 2020
Python

vinaychetnani / Q-Learning-for-Non-Competitive-Bridge-Bidding

reinforcement-learning deep-learning bandit-algorithm

Updated Jan 23, 2018
Python

NickKaparinos / Stanford-CS-234-RL-2022

Solutions to the Stanford CS:234 Reinforcement Learning 2022 course assignments.

deep-reinforcement-learning stanford-university pytorch dqn bandit-algorithm policy-gradients

Updated Jun 27, 2022
Python

mgpopinjay / bandit-algorithms

A small collection of Bandit Algorithms (ETC, E-Greedy, Elimination, UCB, Exp3, LinearUCB, and Thompson Sampling)

online-learning bandit-algorithm

Updated May 25, 2022
Python

Improve this page

Add a description, image, and links to the bandit-algorithm topic page so that developers can more easily learn about it.

Curate this topic

Add this topic to your repo

To associate your repository with the bandit-algorithm topic, visit your repo's landing page and select "manage topics."