为您找到约 1 条结果,搜索耗时:0.0008秒

通过强化学习实现智能电网定价

...时考虑了服务提供商(SP)的利润和客户(CU)的成本。强化学习(RL)用于说明分层决策框架,其中动态定价问题被表述为离散有限马尔可夫决策过程(MDP),并采用Q学习解决该决策问题。通过使用RL,SP可以在在线学习过程中...

微信捐赠

微信扫一扫体验

立即
上传
返回
顶部