为您找到约 1 条结果,搜索耗时:0.0035秒

通过强化学习实现智能电网定价

...SP)利润和客户(CU)成本。强化学习(RL)用于说明分层决策框架,其中动态定价问题被表述为离散有限马尔可夫决策过程(MDP),并采用Q学习解决该决策问题。通过使用RL,SP可以在在线学习过程中自适应地确定零售电价...

微信捐赠

微信扫一扫体验

立即
上传
返回
顶部