为您找到约 1 条结果,搜索耗时:0.0019秒

通过强化学习实现智能电网定价

...利润和客户(CU)的成本。强化学习(RL)用于说明分层决策框架,其中动态定价问题被表述为离散有限马尔可夫决策过程(MDP),并采用Q学习解决该决策问题。通过使用RL,SP可以在在线学习过程中适应地确定零售电价,从而...

微信捐赠

微信扫一扫体验

立即
上传
返回
顶部