清华大学交叉信息研究院博士生潘玲荣获2020年“微软学者”奖学金。本年度“微软学者”奖学金共有来自全亚洲36所顶尖研究型大学及机构的106名优秀博士生参与角逐,潘玲成为最终荣膺此项殊荣的12位获奖者之一。
潘玲与“微软学者”奖学金的缘分始于2016年,那时的她还未曾想过自己有一天也会成为其中的一员。“第一次知道微软学者奖学金应该是本科三年级的时候,读了一篇文章,看到作者刚刚获得了微软学者奖学金,我当时觉得这个奖学金非常厉害。”
2017年9月,潘玲成为交叉信息院的直博生。在导师黄隆波副教授的悉心指导下,潘玲开始接触强化学习,并正式开启了她的科研生涯。“我博士时期的第一个工作是关于强化学习在共享自行车调度的应用。这个工作让我对于强化学习产生了很大的兴趣。这个工作结束之后,2018年的暑假我在导师黄隆波老师的推荐下到微软亚洲研究院机器学习组实习,指导老师是陈薇老师。我在实习期间做的工作是我第一个强化学习理论方面的工作。但过程并不顺利,直到我实习结束文章也还没有中。实习结束后,我回到了学校。但我并没有放弃,而是不断的改进自己的工作。同时也开展了其他的科研工作,继续探索鲁棒、高效、实际的强化学习算法。在不断坚持下,实习的工作发表在了今年的IJCAI。而其它工作的成果也先后发表在NeurIPS、AAAI、AAMAS上,其中在NeurIPS 2020上的工作提出了新的无模型的SD3算法,在若干连续控制的任务中,其性能超过了目前性能最好的TD3和SAC算法。”
“微软学者”奖学金是对潘玲科研实力与潜力的认可。“知道自己获奖时感到非常开心和激动。我觉得这个奖不仅是对过去的研究成果的认可,更是对我未来研究工作的支持和鼓励,强化信心和动力,激励我去探索领域中重要的科研问题,做出有意义的研究。同时我也非常感谢我的导师黄老师一直以来的指导、支持和鼓励。我觉得在我目前读博士的过程中,最重要的三个字是不放弃,不管被拒多少次,成功可能就在下一次。希望大家能找到自己热爱的重要的研究方向,努力做出有意义的工作,推进所研究的领域的发展。”
个人简介
潘玲,清华大学交叉信息研究院四年级博士生,师从黄隆波副教授,主要研究方向为强化学习,包括理论理解与分析、算法设计与提升以及实际应用。她关注于研究鲁棒、高效、实际的强化学习算法,目前已发表第一作者论文5篇,相关研究成果发表在顶级会议NeurIPS、AAAI、IJCAI、AAMAS上,其中,她在AAMAS 2020的文章 (前5%)受邀投往JAAMAS的fast-track评审通道。她曾获得国家奖学金、交叉信息院一等奖学金等。
关于“微软学者”奖学金
“微软学者” 奖学金是微软亚洲研究院1999年启动的一项面向亚太地区计算机科学以及相关专业和交叉学科的优秀博士生的项目。该奖学金项目旨在发掘、支持和鼓励优秀的、有潜力的低年级博士生更好地开展研究工作。除了奖学金之外,微软学者将会被邀请至微软亚洲研究院与全球顶尖的研究员一起进行学术研究、有机会与图灵奖获得者面对面交流,并获得参加微软“二十一世纪的计算大会”、微软学术峰会等大型学术活动的机会。截至2020年,先后有来自亚太地区 50 余所高校的 429 名优秀博士获得微软学者称号。其中多位微软学者已经成为学术界中流砥柱或耀眼新星,也有多位微软学者成为工业界翘楚。