近日,williamhill官网、统计科学中心陈松蹊团队的论文Relative importance of meteorological variables on air quality and role of boundary layer height在大气环境权威期刊Atmospheric Environment发表。
空气污染治理是目前中国大部分地区面临的一个严峻挑战。空气质量受到污染排放和气象条件的双重影响,其中污染排放是部分可控的,气象条件是完全不可控的。为了客观地评价空气污染治理情况,我们需要剔除气象因素对观测值的影响,从而衡量污染排放水平。目前,尽管有诸多研究关心不同气象因素与空气污染物浓度之间的关系,但气象要素对空气污染浓度的相对重要性研究仍然缺乏。鉴于气象变量之间存在相关关系,对一个区域中的大气污染物,是否存在一个相对稳定的气象重要性顺序?一个稳定的排序将意味着大气污染的气象过程存在一个共同机制,这将有助于对空气污染物的建模和评估。除了关心不同气象变量的相对重要排序,论文也对大气边界层高度 (BLH)这一变量的角色进行探讨。边界层高度作为一个重要的垂直方向上的气象变量,影响了空气污染物的纵向扩散空间,因此对污染物地面浓度有直接的影响。然而,与地面气象变量不同,边界层高度数据需要复杂的测算方式,无法通过地面气象站点直接观测。欧洲中期天气预报中心 (ECMWF) 同化的 BLH 数据存在约三个月的延迟。我们关心是否可以用地表气象变量解释边界层高度中的信息?以及边界层高度与否对气象调整后的空气污染浓度影响是否显著?
论文使用了北京、天津、石家庄、济南、郑州和太原六个城市53个国控监测站的六种大气污染物PM2.5、PM10、SO2、CO、NO2 和 O3(O3为中午12:00-晚上7:00)的浓度数据。气象变量包括露点温度(DEWP)、气温(TEMP)、气压(PRES)、边界层高度(BLH)、累积风向(WD)、累积风速(IWS)和累积降水(IPREC),边界层高度(BLH)。边界层高度数据来自欧洲天气预报中心(ECMWF)的格子点数据,其余来自地面气象站点。该研究均使用小时数据,研究时间段为2013年3月至2021年2月的八个季节年。
论文通过分析华北平原六大主要城市,北京、天津、石家庄、济南、郑州和太原的气象与空气质量数据,采用非参数统计回归探究气象变量对空气污染浓度值的影响,利用前向变量选择法给出不同气象变量对空气污染浓度影响的相对重要性排序。研究发现,影响华北六大城市污染浓度的气象变量顺序上有很强的一致性。在六种污染物的变量选择结果中,PM2.5、PM10、SO2 和 CO 四种污染物具有共同的以露点温度为主导的气象变量重要性顺序;NO2 和 O3 则分别主要受边界层高度和气温的影响,而其他气象变量与 PM2.5的相对顺序相似。这表明华北地区六种大气污染物的气象过程具有很强的规律性。此外,尽管边界层高度与污染物存在显著负相关性,但是在考虑了其他地表气象因素后,边界层高度在除NO2外的五种空气污染物中的重要性排序并不高,在本文关心的七种气象变量中,往往处于第四位甚至之后。并且,论文研究发现,六个城市的地表气象变量可以解释边界层高度中超过 77% 的统计学变异(variance),而在对空气污染浓度气象调整的分析中,尽管BLH对NO2有着最重要的影响,在考虑了地表气象变量后BLH 对 NO2 浓度气象调整的影响仅为1.24%,对其他污染物浓度的影响更低。因此,地表气象变量可以在较大程度上包含边界层高度信息,且从排放角度评估空气质量而对观测污染浓度进行气象调整时,仅考虑地表气象变量就可以得到比较准确的结果。
论文利用统计学中非参数回归和前向变量选择方法,给出了六个城市不同污染物的气象变量重要性排序。通过综合不同城市不同季节的排序结果,论文发现PM2.5、PM10、SO2和CO有相同的排序结果,而NO2和O3则有单独的排序。具体排序如下:
PM2.5,PM10,SO2,CO:DEWP,PRES,TEMP,BLH,IWS,WD,IPREC
NO2:BLH,DEWP,PRES,TEMP,IWS,WD,IPREC
O3:TEMP,DEWP,PRES, BLH,IWS,WD,IPREC
该论文的第一作者是英国威廉希尔公司元培学院2021届毕业生黄雅轩(现加州大学伯克利分校统计系博士生),其本科期间的学术导师是陈松蹊教授。文章的共同通讯作者是西南财经大学郭斌副教授和陈松蹊教授。其他作者是英国威廉希尔公司大数据科学研究中心2019级硕士研究生孙浩轩和2019届硕士毕业生刘慧杰。
六城市2013-2020年对PM2.5非参数回归建模中气象变量重要性排序的季节平均。不同颜色的点代表不同气象变量在该城市该季节的排序平均值,水平虚线标出了六个城市的平均水平。