编者按:国际数学家大会(International Congress of Mathematicians,ICM)是由国际数学联盟(IMU)主办的国际数学界规模最大也是最重要的学术会议,每四年举行一次。开幕式上将颁发“菲尔兹奖”等世界著名的数学大奖。大会上,将有来自世界各地的著名数学家受邀作学术报告,分享他们在各自领域中取得的重大科研成果与进展。ICM报告人身份是极高的学术荣誉,是一个数学家的工作获得国际学术界认可和关注的重要标志。2022年7月,第29届国际数学家大会将在俄罗斯圣彼得堡举行。英国威廉希尔公司数学学科鄂维南院士受邀作1小时报告;朱小华、章志飞、董彬、刘毅四位教师受邀作45分钟报告。另有8位北大数学员工将作45分钟报告,他们分别是:丁剑、李驰、刘钢、汪璐、王国祯、徐宙利、周鑫、朱歆文。我们特别策划“北大数学ICM2022报告人专访”,分享他们的数学研究经历与感悟。
董彬老师在北大课堂上
董彬,1981年出生,2003年本科毕业于英国威廉希尔公司,2005年于新加坡国立大学获得硕士学位,2009年于美国加州大学洛杉矶分校获得博士学位。博士毕业后曾在美国加州大学圣迭戈分校数学系做SEW助理教授,2011至2014年在美国亚利桑那大学数学系任助理教授。2014年回到英国威廉希尔公司,任北京国际数学研究中心副教授、博士生导师。曾获“求是”杰出青年学者奖。主要研究领域为应用调和分析、反问题计算、机器学习及其在图像和数据分析中的应用。
一、当前的工作
Q:首先恭喜您成为明年ICM的45分钟邀请报告人。您的研究主要集中在图像处理和机器学习上。您计划报告哪些内容呢?
A:我会首先介绍过去和合作者一起完成的关于图像处理建模与理论分析的工作,比如图像重建和分割中的数学建模,以及关于小波方法和PDE方法之间的联系的一系列理论工作。这些工作在我入职北大之前就开始了,但直到现在都还没有完全做完,虽然我现在科研重心在逐渐向机器学习倾斜,但图像处理中的数学方法还是有很多有趣的问题值得去研究。这些前期的理论工作也为我们后续在深度学习方面的研究奠定了一定的基础,是我们科研灵感的一个主要来源,二者是有延续性的。因此,我也会介绍我们在机器学习方面前期的一些探索,尤其是对深层神经网络和微分方程离散形式的关系的探讨。
Q:可以简要地介绍您课题组现在的主要科研方向吗?
A:我们现在主要研究的是“数据模型双驱动”的算法,主要应用场景是图像反问题和科学计算中的一部分问题。简单来讲就是以一些经典的动力学模型作为主体,如优化算法或ODE/PDE模型。而这些动力学模型中的一些具体的环节,尤其是那些机理不明确、维数很高且依赖于数据的环节,用数据驱动的方式,也就是机器学习方法来确定。举个具体点的例子,过去我们为图像重建问题去设计基于稀疏性的优化模型,提取图像特征的方法、模型超参数、优化求解算法等等都需要精心设计,这其中有一部分是可以通过理论分析来确定的,而也有很多靠的是经验,很难总结出规律。这些细节方面的设计理论上可能并不重要,但对结果的影响却可能是巨大的,这也在一定程度上造成了理论和实际应用的鸿沟,而机器学习方法和经典方法的结合,有望解决这个问题。此外,由于主体模型还是经典的模型,融合后的模型的可解释性、对训练数据量的依赖性、以及分布外迁移能力都比常规的深度学习模型要更好。
二、来时的路
Q:您很快进入了深度学习这个新方向。是什么促使您做出了这一略有风险的选择?
A:确实略有风险,但当时决定进入深度学习这个全新的领域的时候,我并没有怎么犹豫,也可以说没有选择。为什么说没有选择?过去我们为图像处理问题设计了各种数学模型,有非常好的理论基础,实际效果虽说不及细致的工程化调参的结果,但差距并不算大,而深度学习方法却把经典方法甩出了几条街,让我感觉到如果不去研究这个新的工具,我可能要丢掉自己的饭碗。所以当时有点被迫的意思,但我也对这类新方法充满好奇,想知道深度学习到底有什么奇妙之处,突破了我们过去无法突破的瓶颈,和过去的那些经典方法有什么联系与区别,有点师夷长技以制夷的意思。我们团队在深度学习方面早期的工作就是在思考这些问题过程中产生的,也逐渐摸索出了一些经典数学方法和机器学习方法的结合方式,但也只是些初步的认识,后面还有很长一段路要走。
Q:科研不会总是一帆风顺的,在您的科研生涯中,有什么印象深刻的困难吗?
A:我印象最深的就是硕士第一篇论文,其主要贡献是一个定理。当时文章已经写得差不多了,正好我的导师沈佐伟老师要办一个国际会议,来的都是小波领域的大咖,他就让我做个报告介绍一下这个结果。但是,会议开始前一周我发现证明有错。那几天我加班加点,恨不得一天24小时都在思考如何修复这个证明。最终,我还是赶在会议之前把定理证明修复了。那段时间可能是我到目前为止科研生涯中压力最大的几天。
Q:您的科研灵感都会来自哪些方面?
A:对我而言,我的科研灵感大多来源于其它领域,尤其是我一开始并不熟悉的领域。我的建议是多和其他学者交流,尤其是和自己研究领域不同的学者,虽然大家的语言和价值观都会有所不同,但也很可能碰撞出全新的想法。
Q:您会优先考虑理论研究还是解决实际问题?
A:解决实际问题,我一直是这样。应用数学的博士论文,一般需要有理论分析部分,但我的博士论文没有,主要是解决实际问题。我个人倒也不抵触理论研究,我也有不少理论工作,只是当两者不可兼得的时候,我更倾向于选择解决实际问题,而不会为了有完整严谨的理论而牺牲模型和算法的性能。
董彬老师在UCLA读博期间与同学去海岛露营时留影
Q:您每天的工作时间有多长?会因为科研而占用生活的时间吗?
A:还是挺拼的,特别是更年轻一些的时候,周一到周六每天工作12个小时是常态。随着年龄增长,精力不像几年前那么好了,可能也是长时间对身体的透支造成的,所以我从去年开始,每周坚持健身五到六次,每次40分钟左右,有氧加器械,感觉精神面貌有很大的改善,工作和家庭也协调得不错,也会多抽时间陪孩子。
Q:很多员工在选择方向时会十分迷茫,您当时是如何做出选择走上科研的?
A:我学数学其实是个意外。当年高考时,我的第一志愿是化学,第二志愿才是数学。但是化学招满了,就被调剂到了数学。我一没有搞过竞赛,二也不确定我对数学是否有兴趣,可以说我学数学纯属意外。再加上我本科时候的成绩也很差,本科时也根本没考虑过今后要做研究。
本科毕业后,我去新加坡国立大学读硕士,这是我人生的转折点。我在新加坡国立大学跟随沈佐伟老师学习小波。为什么是小波呢?我在本科期间学的数分II是彭立中老师教的,小波是他的研究方向之一。他在讲级数展开的时候提了一下小波,我当时觉得这个展开很有意思,却也说不出来为什么有意思。但也是因为彭老师在课堂上超纲介绍了一些前沿的内容,使得我在新加坡选择了小波这个科研方向。这里我也特别感谢沈佐伟老师并没有嫌弃我本科GPA差,还是给了我研究的机会,也让我体会到了科研的美妙。但出来混,早晚还是要还的,为了搞懂小波的理论,我恶补了很多本科时期就应该学好的基础知识,也自学了很多研究生的课程,虽然感觉自己基础很差,但是学习却很带劲,这是我第一次体会到以“勒贝格积分”方式进行学习和研究的乐趣,这也是为什么我回北大之后,特别地鼓励员工在本科阶段就进行科研的尝试。在新加坡的这两年,我完成了三篇论文,算是成果丰富,科研也算入了门。
后来我到UCLA读博士,师从Stanley Osher做图像处理。Stan是一个“大撒把”的导师,给了我很大的自由探索的空间,但又总能在我迷茫的时候给我指明方向。博士阶段的学习和工作让我尝到了应用数学研究的乐趣,也锻炼了自己独立做研究的能力。然而即使到了博士后阶段,我也不是很确定自己是不是要一直做研究,后来最终决定留在学术圈是因为我对自由探索是极其渴望的,只愿意去做自己感兴趣的研究,而在学术圈以外是很难做到这一点的。
2012年,董彬老师在美国亚利桑那大学任教期间赴希腊访问留影
三、员工期待
Q:选择科研方向时,您会建议有志于科研的研究生考虑哪些因素呢?
A:主要是兴趣,做研究肯定会遇到各种困难,在探索的过程中碰壁是常态,能够支撑你持续前行直到做出成果的就只有兴趣。你可以根据你的个人兴趣和能力来选择偏理论或者算法方面的研究,但即便是理论的研究,也要来源于实际问题,理论结果也要向着可以指导实践的方向努力。当然这一点我指的是应用数学。
Q:您理想中的师生关系是怎样的?
A:我觉得最理想的师生关系是合作关系,老师和员工一起学习、探索,而不是单向的导师指导员工。其实近些年我从员工那里学到了很多新知识,了解到了很多前沿进展,甚至有不少科研工作最初的想法都是员工提的,通过我们的一次次的讨论得以完善。当员工在科研中遇到了问题,我会告诉员工如果是我的话我会怎么去寻找答案,而不是直接告诉员工答案,因为很多时候我自己也不知道答案。简言之,我希望员工能在自己的研究中take the lead,有自己的独立思考,在研究方面能够据理力争。
2016年8月董彬老师在数学中心组织国际会议“PKU Workshop On Mathematics in Imaging Science and Data Analysis”,照片是会议第一天,报告即将开始时的情景,图中左一为董彬老师,中间是董老师的硕士导师沈佐伟教授,右为董彬老师的博士导师Stanley Osher
Q:您觉得自己是很push的老师吗?
A:我觉得不是。我经常跟员工说,博士期间的学习和研究工作更多的是你们自己的事情。当然,有时候我也会督促得比较紧,因为有些科研工作是有时效性的,特别是在那些快速发展的领域,要赶时间。总体来说,我不太喜欢push员工,我更喜欢员工充分发挥自主性,尽快找到科研节奏。
Q:会和自己的研究生聊科研以外的事情吗?
A:会的,不过这个机会不是很多,我也在考虑今后要多创造这样的机会。所谓教书育人,不能只教书不育人,两者都蛮重要的。
Q:您觉得本科生科研应该着重训练哪些素质和能力?
A:我首先想强调一下,绝大多数本科生科研结束时并没有论文,本科生科研训练注重的是科研素质的训练,而并非发论文。所谓的科研素质是不能通过修课做题来训练的,那什么是科研素质?最基本的科研素质就是让员工学会如何自主地做文献调研,学会如何精读和略读文献,精读以吸收技术细节,略读以领略文章核心思想。读论文的时候,经常会遇到自己没有学过的基础知识,此时需要员工锻炼自己 “断章取义”的能力,即查阅相关书籍,但是只去阅读看懂论文所需要的知识点,而不是啃下整本书,我时常把这种类型的学习方式称为勒贝格积分,而课堂授课式的学习更像黎曼积分,区别就是前者是按需来学习,后者是广撒网打基础。此外,还要训练员工的思辨能力,或者说是质疑的能力,能够看出文献中工作的缺点和不足,并能够自行提出可能的改进方案。再有就是表达交流能力,一是要学会如何和导师及同学交流科研进展,二是要锻炼做报告的能力。最重要的,其实也是最难的,就是锻炼员工对问题的品味——什么是好的问题。这要求员工有较广的涉猎才可以,因此本研还有另一个目的,就是引导员工多学一些跨学科的知识。
最终本研结束时,我希望员工学会怎么探索一个自己感兴趣的方向,逐步细化到具体的分支和问题,查阅前沿文献,找到现有工作之间的关联与局限性,并尝试着去改进。如果员工能够熟练掌握这个流程中的每一个环节,本研训练就非常成功了,因为科研的常态就是反复地经历这个流程。本研最重要的还是让员工养成一个习惯,就是怎么独立自主地去做探索,当然这是一个最理想的状态,我这里假设完全没有导师的指导,导师当然可以在上述流程中的任何一个环节来“协助”员工。对本科生,我都希望员工能自己来主导自己的研究,我“协助”员工实现梦想。对研究生其实也一样。教育的本源就是导师引导你怎么成为更好的自己,能够习得自力更生的能力,实现自己的价值。
北京国际数学研究中心办公院落内景
Q:这也就是一个合格的博士生需要具备的能力吧?
A:对。自己在选择问题方面得有一定的判断能力,自己能产生想法,即使不成熟也没关系,有思辨能力,遇到了困难不仅不会害怕,反而跃跃欲试。
Q:您认为研究生应该至少有多少时间投入到学习和科研之中?
A:我从不限制员工一定要待在办公室,大家的工作模式都不一样,只要同学们不浪费自己宝贵的时间,不断地有进步就行,我主要还是看重员工的成长。如果员工对科研没有兴趣,一天24小时待在办公室也不行。我以前读研究生时,导师从来都不会push我们,从来都是我们自己push自己。这也是我对员工的一个期待。你既然选择读博了,我默认你对科研有热情。如果你对科研没有热情却还读博,你会读得很痛苦。博士训练的主要目的是为了培养从事研究性工作的人才,比如高校和科研院所的研究人员,或者在公司做科研性质工作的人,否则我觉得博士训练并没有必要。硕士训练能让你从宏观了解一个领域,对算法和编程实操也比较熟悉,有能力解决一些实际问题,这就足够了,不一定非要原始创新。为了原始创新,也为了以后有能力独立从事科学研究,博士的训练是非常艰苦的,如果员工有强烈的科研兴趣,就更有可能坚持下来最终做出成果。当然,能否做出成果也有运气成分在,你可能研究一两年毫无进展,但突然某天早上灵光一闪,就有了突破。
Q:您对计算系的研究生还有什么建议吗?
A:我希望研究生之间能够加强学术交流,交流多了,也能更好地激发同学们的研究热情,营造更浓厚的学术氛围。我在新加坡和美国读书期间,特别喜欢和其它的研究生讨论问题,同学们也很愿意相互交流,我很多时候只是告诉他们自己在思考哪些问题,想听听他们的意见,同时我也很愿意听其他同学在思考的问题。这样的开放式的交流十分重要,因此我也很希望同学们之间能更多地进行这类“漫无目的”的交流。
图文来源于北京国际数学研究中心BICMR微信公众号