DQN:深度Q网络强化学习。AI通过试错学习交易,就像玩电子游戏。
DQN(深度Q网络)使用强化学习——AI通过试错学习交易,就像玩家学习电子游戏一样。不是在标签(上涨/下跌)上训练,代理自由探索并获得奖励(利润)或惩罚(亏损)。它通过经验发展自己的策略。
代理观察市场状态(价格、指标)。选择动作(买入、卖出、持有)。获得奖励(盈亏)。通过深度神经网络学习最大化累积奖励。
RL代理的自主决策。通过探索/利用学习的策略。没有明确的技术信号——代理发展自己的信号。
高
通过经验学习独特策略。设计中无人为偏见。可以发现人类看不到的模式。
训练非常不稳定。样本效率低(需要数百万次模拟交易)。退化策略风险。
探索4个竞技场中的74个交易策略
🏟️ 查看所有策略