Q-Learning Visualizer

Usage

サンプルコード

入力方法については以下のコードを参考にしてください。 必ずしもこれに従う必要はありません。

import numpy as np import random N = 1_000_000 # 試行回数 H = 5 # 盤面の縦サイズ W = 5 # 盤面の横サイズ ACTIONS = 4 # 上下左右の行動数 def main(): # Q 値を初期化 q = np.zeros((H, W, ACTIONS)) # 繰り返し (1 から N まで) for round in range(1, N + 1): # Q 値を更新する (省略) # ... # 1000 回に 1 回出力 # 小数点以下 3 桁まで表示 if round % 1000 == 0: for i in range(H): for j in range(W): for k in range(ACTIONS): print(f"{q[i][j][k]:.3f}", end=' ') print() if __name__ == "__main__": main()

Input


Result

Line: 0 / 0

お知らせ + 宣伝