好久不见了

这几天干了什么也没写,就记得个上周帮老师调研了什么,周五开会又布置了什么任务
整个周末都在写智能计算系统的实验,本来还想记录的
但其实我所有的内容都是靠GPT写出来的,完全不用改就能运行通过

之前找的答案是4年前的,北大学生上传的
他们那会还没有GPT,感觉自己跟他们的差距真的相当的大。

今天周一

刚把老师分配的任务给做完,下午2点,打算这篇写完就休息一会(崩铁),然后就能学自己喜欢的强化学习咯。

未来要做的事

深度学习的实验做完了,在提交之间可以做一个完善

深度学习的实验我自制了一个分块卷积网络(依然是靠着GPT),正确率不到90,就这样吧有机会再改改
智能计算系统实验也是全部满分了,可以的话找个时间git上去好了
这一周估计就是强化学习把那个五子棋环境跑通了,然后还要实现两种方法的AI下五子棋。

pycharm是真的不好用,风扇呼呼响的

关于强化学习gym环境的训练可视化

要用类似如下代码

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
env_name = 'CartPole-v0'
env = gym.make(env_name, render_mode="human")

for i in range(10):
with tqdm(total=int(num_episodes / 10), desc='Iteration %d' % i) as pbar:
for i_episode in range(int(num_episodes / 10)):

episode_return = 0
state = env.reset()
# print(f"env reset state shape {state}")
done = False
while not done:
env.render()
if isinstance(state, tuple):
state = torch.tensor(state[0])
action = agent.take_action(state)
# print(f"agent take action is {action}")
next_state, reward, done, _, _ = env.step(action.item())

就能正确渲染出画面了