新浪新闻客户端

每2秒匹配1个网约车订单,东大团队斩获数据挖掘国际顶尖赛事KDD CUP年度冠军

每2秒匹配1个网约车订单,东大团队斩获数据挖掘国际顶尖赛事KDD CUP年度冠军
2020年08月03日 09:20 新浪网 作者 盐阜大众报新媒体

  由东南大学交通学院刘志远教授指导的参赛队伍TLab (参赛学生包括刘洋博士,吴凡优博士,吕呈硕士)在KDD Cup 2020 Reinforcement Learning Competition Track: Vehicle Repositioning Task中获得冠军。

  ACM SIGKDD Conference on Knowledge Discovery and Data Mining(简称KDD)是国际数据挖掘领域的最高级别的学术会议之一。其中KDD CUP是ACM SIGKDD组织的年度赛事,有数据挖掘领域“世界杯”之称,是目前数据挖掘领域最高水平、最具影响力、规模最大的国际顶级赛事。

  2020年的KDD CUP开设3个竞赛赛道,其中强化学习竞赛赛道由滴滴出行承办。参赛者需要解决网约车平台的订单匹配与车辆调度问题,其中订单匹配任务需要每两秒钟进行一次匹配,车辆调度任务则需要在成都8000余个六边形网格内进行运力调度。相关算法可将乘客潜在出行需求与合适的司机相匹配,从而更高效地利用空置车辆,提高车辆周转率,提升用户体验与司机收入水平,优化系统运营效率。

  刘志远介绍,现有的多智能体强化学习方法将每一辆车看做是一个智能体,在进行仿真时,车辆按照调度算法前往目的地或者进行有偏随机游走,并没有考虑司机的偏好。这会带来以下问题:当多辆车状况相同时(并发情况),这些车辆的决策是相同的,也就是在这种情况下多个智能体是“冗余”的,只是其中一个的“副本”。针对现有方法的不足,TLab团队对现有方法进行了系统、全面的优化,进一步设计了一种更符合逻辑的单智能体深度强化学习方法。例如,该方法将单智能体作为智能“调度中心”,车辆发出调度请求后,“调度中心”进行全局运力调度。结合此前在大规模时空预测中的经验,进一步对研究区域进行筛选并自定义了一个N×N的网格,综合分析整座城市订单、车辆、价值的时空分布等全局信息,以及车辆当前位置等局部信息。采用了一个经过剪枝的全局动态空间, 防止车辆陷入局部最优。

  经过几个月激烈较量,东南大学TLab团队最终以优异的成绩在全球1000余只队伍中摘得桂冠(奖金$8000)。南京大学LAMDA Group、来自日本的NTTdocomo团队分别获得二、三名。

特别声明:以上文章内容仅代表作者本人观点,不代表新浪网观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与新浪网联系。
网约车
权利保护声明页/Notice to Right Holders 我要反馈
新浪新闻客户端
新浪新闻客户端

扫描左侧二维码下载,更多精彩内容随你看。(官方微博:新浪新闻

图片故事

新浪新闻意见反馈留言板 400-052-0066 欢迎批评指正

违法和不良信息举报电话:4000520066
举报邮箱:jubao@vip.sina.com

Copyright © 1996-2020 SINA Corporation

All Rights Reserved 新浪公司 版权所有