新浪新闻客户端

直播丨华为诺亚方舟ICLR满分论文:基于强化学习的因果发现

直播丨华为诺亚方舟ICLR满分论文:基于强化学习的因果发现
2020年03月30日 18:06 新浪网 作者 AI科技评论aitechtalk

  ICLR 2020 系列论文解读公开课第四期,就在本周二 20:00 整(北京时间)。

  AI科技评论 x AI研习社联合出品

  针对ICLR 2020不能现场参会的特殊情况,AI研习社联合AI科技评论组织策划了【ICLR 2020 系列专题】活动,【ICLR 2020系列论文解读公开课】是其中重要的组成部分,另外还包括系列论文文字解读,会议数据分析,会议资源下载等。

  疫情拉开了大家的距离,但是学术交流是不会就因为疫情被阻挡的,我们愿架起这座学者之间的桥梁,以最短路径,让更多学者能更快的参与其中,促进学术交流,让知识真正流动!

  本次直播为【ICLR 2020 系列论文解读公开课】第四期,此论文来自华为诺亚实验室的 ICLR 2020满分论文《Causal Discovery with Reinforcement Learning》,我们有幸请到了论文的一作、华为诺亚方舟实验室高级研究员朱胜宇博士带来“基于强化学习的因果发现”的分享。

  论文简介如下:

直播丨华为诺亚方舟ICLR满分论文:基于强化学习的因果发现

  论文地址:https://arxiv.org/pdf/1906.04477.pdf

  因果研究作为下一个潜在的热点,已经吸引了机器学习/深度学习领域的的广泛关注,例如Youshua Bengio和Fei-Fei Li近期都有相关的工作。因果研究中一个经典的问题是“因果发现”问题——从被动可观测的数据中发现潜在的因果图结构。

  华为诺亚方舟实验室因果研究团队将强化学习应用到打分法的因果发现算法中,通过基于自注意力机制的encoder-decoder神经网络模型探索数据之间的关系,结合因果结构的条件,并使用策略梯度的强化学习算法对神经网络参数进行训练,最终得到因果图结构。

  在学术界常用的一些数据模型中,该方法在中等规模的图上的表现优于其他方法,包括传统的因果发现算法和近期的基于梯度的算法。同时该方法非常灵活,可以和任意的打分函数结合使用。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
诺亚方舟华为
权利保护声明页/Notice to Right Holders

举报邮箱:jubao@vip.sina.com

Copyright © 1996-2024 SINA Corporation

All Rights Reserved 新浪公司 版权所有