设为首页 - 加入收藏
广告 1000x90
您的当前位置:12555主二肖com > 聚类分析 > 正文

201705:基于函数型数据聚类的京津冀空气污染特征分析(梁银双等

来源:未知 编辑:admin 时间:2019-06-03

  内容摘要:近年来,京津冀地区的空气污染问题受到高度关注,为探讨该地区空气污染的特征,文章采用函数型数据的聚类分析方法对空气质量指数()进行研究。首先将空气质量指数变化曲线,通过函数型数据的主成分分析进行降维,其次将主成分基系数进行将京津冀地区空气污染的聚类结果在地图上直观实现。结果表明,京津冀地区空气污染在空间上可划分为类典型区域,呈现由北向南逐渐加重的趋势;在时间分布上有明显的相似性,具有显著的季节特征。

  我国大气污染的区域性特征日益明显,以臭氧、PM2.5和酸雨为特征的区域性复合型大气污染十分突出,在京津冀城市群的13个地级及以上城市中,有11个城市排在重污染榜单的前20位。京津冀地区的空气污染问题受到国家的高度重视,2013年国务院下发的国家大气污染防治行动计划,明确提出将改善京津冀区域空气质量列入重要工作日程。同时,京津冀地区也是世界性雾霾问题最突出的地区之一,雾霾的成因、污染的特征及空气污染的区域合作治理是近年来研究的热点问题[1-4]。王冠岚等(2016)研究了2014年京津冀空气污染时空分布特征及成因分析[5],郑晓霞等(2014)研究了京津冀地区NO2污染特征[6],周磊等(2016)分析了京津冀PM2.5时空分布特征及其污染风险因素[7],杜晓惠等(2016)着重分析电力行业排放对津冀PM2.5的贡献[8],张霖琳等(2014)对京津冀地区城市环境空气颗粒物及其元素特征做了详细分析[9]。

  上述研究对京津冀地区空气污染的特征及影响因素、气象因素的分析透彻全面,但统计方法的应用上不够深入。根据国家城市环境空气质量实时监测数据的发布,对于某个监测点,空气质量数据按时间维度持续更新,具备函数特征,与其将小时数据(日数据)看成离散点,不如以日(或年)为周期看作曲线,并将曲线视为抽象空间(如希尔伯特空间)的一个整体元素,进行函数型数据分析[10]。函数型数据分析(Functional Data Anylasis)是近年来统计学研究的热点,也广泛应用在了空气质量问题的研究上,Febrero et al(2008)研究了NO2浓度日变动曲线的整体异常识别方法[11],Giraldo et al(2011)讨论了空气质量曲线],Estevez et al(2013)基于方差分析,研究了不同监测点空气质量变动曲线差异的假设检验问题[13],Ignaccolo et al(2008)基于样条逼近,给出了一种空气质量变动曲线]。

  聚类分析是统计研究的重要方法,是将样本观测数据在没有先验知识的条件下,根据数据的特征,按照其在性质上的“亲疏程度”自动进行分组,使组内个体的结构特征具有较强的相似性,组间个体的特征具有较弱的相似性。近些年,函数型数据的聚类方法也逐渐成熟

  ,主要分为三类:降维之后使用传统方法聚类(如K-均值、系统聚类等);采用特殊距离或曲线差异的非参数方法;基于模型的聚类方法。总的来说,函数型数据聚类的难点都是因为数据属于无限维空间,本文先采用函数型数据的主成分分析(Functional Principal Component Analysis,简称FPCA)进行降维,其次采用k-均值聚类,最后利用ArcGIS9.3将京津冀地区空气污染的聚类结果在地图上直观实现。

  研究数据来源于中华人民共和国环境保护部数据中心公布的《全国城市空气质量日报》,数据具有权威性。日报发布形式为空气质量指数(

  )、首要空气污染物、空气质量级别等。其中,AQI是定量描述空气质量状况的无量纲指数。针对单项污染物还规定了空气质量分指数。参与空气质量评价的主要污染物为细颗粒物(PM2.5)、可吸入颗粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、臭氧(O3)、一氧化碳(CO)6项。城市AQI由单项污染物空气质量分指数的最大值确定。

  个地级市作为研究对象,整理了2014年和2015年空气质量指数逐日数据并进行分析。对于每个城市,空气质量指数数据按时间维度持续更新,具备函数特征,以年为周期,利用非参数平滑技术,拟合成曲线,在泛函分析的角度,将曲线视为希尔伯特空间(Hilbert space)的一个元素。2014年和2015年京津冀地区的空气质量变化趋势如图1和图2所示。

  左图为2014年AQI原始数据,右图为拟合后的2014年13个城市AQI年度变化曲线

  左图为2015年AQI原始数据,右图为拟合后的2015年13个城市AQI年度变化曲线

  中拟合的各地空气质量的年度变化曲线,进行函数型主成分分析(FPCA),然后根据方差贡献率提取前L个主成分作为基底,降为低维空间,最后对基系数进行K-均值聚类。函数型主成分分析是构成该聚类方法的重要工具,下面详细介绍。

  年和2015年空气质量变化曲线个主成分,累积方差贡献率分别为89.1%和85.7%,可以代表曲线的大部分信息。

  ),来具体分析空气污染的时间分布特征。京津冀区域空气质量指数AQI在2014年和2015年有一致的变化趋势,在时间分布上有明显的相似性,具有周期性和显著的季节变化特征,总体表现为冬季最高,秋季、春季次之,夏季最低。1、2月份AQI值都较大,达到峰值;3月份开始降低,8、9月份AQI达到最低值;10月份起,AQI值均明显反弹,11、12月份再次达到峰值,整体呈现中间低、两边高的态势。

  年相比,震荡的幅度有所降低,AQI高值区域有所减少,空气质量有好转趋势。具体来看,空气质量最好的张家口AQI曲线整体相对平缓,季节特征不显著;北京AQI曲线变化居中,空气质量一般;污染严重的石家庄和保定变动明显,且2015年1、2月份空气质量指数比2014年同期有显著下降。

  ),进一步分析空气污染问题在空间上的分布特征。总的来说,京津冀空气质量呈北部山区较优、南部平原区较差的分布特征,表现出明显的空间差异性。位于北部山区的张家口、承德、秦皇岛2014年和2015年都是空气质量较好的地区,属轻度污染的区域;中东部的北京、天津、唐山、廊坊、沧州次之,属中度污染的区域;西南部的保定、石家庄、衡水、邢台、邯郸5个地区空气质量较差,属重度污染的区域,其中污染最严重的地区由2014年的石家庄和邢台转移到了2015年的保定市。2014年位于京津冀北部的张家口、承德和秦皇岛3市空气质量为优良的天数占67%~86%,北京、天津的占46%,保定、衡水和邢台的仅占23%。

  1)京津冀地区空气污染的时空分布特征首先与自然因素和地理位置有关,秋冬季节大气静稳天气增多,不利于污染物的扩散,而春夏季节空气污染减轻依赖于风力加大、降水频繁等气象因素;其次空气污染与工业排放、燃煤排放、机动车排放、人口数量大等因素密切相关。

  类典型区域的划分,有助于确定污染热点区域以及引起污染的源头,有的放矢地制定污染治理策略,进而探索京津冀空气污染区域合作治理模式。污染严重的城市石家庄、邢台、保定都位于河北省,聚集了大量的水泥、钢铁、炼油石化等高污染行业,工业能源消耗仍以煤炭为主,空气污染主要与工业排放有关,因此应积极增加治污投入,调整工业行业结构,走新型工业化道路。(

  )京津冀空气污染问题在空间位置上具有明显的相关性,相邻区域有相似的空气污染特征。鉴于此,在理论上可以进一步考虑对空间相关函数型数据进行聚类。

  郑亦佳,王姝,等.京津冀地区霾成因机制研究进展与展望[J].气候与环境研究,2015,20(3):356-368.

  雷宇,陈潇君,等.京津冀燃煤工业和生活锅炉的技术分布与大气污染物排放特征[J].环境科学研究,2015,28(10):1510-1517.

  赵成根.跨区域大气污染协同治理研究——以京津冀地区为例[J].河北学刊,2016(1):144-149.

  谢婉林,李常敏.京津冀大气污染治理省际合作博弈模型[J].系统工程理论与实践,2014(3):810-816.

  薛建军,张建忠. 2014年京津冀空气污染时空分布特征及主要成因分析[J].气象与环境科学,2016,39(1):34-42.

  李令军,赵文吉,等.京津冀地区大气NO2污染特征研究[J].生态环境学报,2014(12):1938-1945.

  武建军,贾瑞静,等.京津冀PM2.5时空分布特征及其污染风险因素[J].环境科学研究,2016(4):483-493.

  徐峻,刘厚凤,等.重污染天气下电力行业排放对京津冀地区PM2.5的贡献[J].环境科学研究,2016(4): 475-483.

  王超,刀谞,等.京津冀地区城市环境空气颗粒物及其元素特征分析[J].中国环境科学,2014,34(12):2993-3000.

  .海量半结构化数据采集、存储及分析——基于实时空气质量数据处理的实践[J].统计研究,2014,31(5):10-16.

  .基于B-样条基底展开的曲线聚类方法[J].统计与信息论坛,2013,28(9): 3-8.作者简介

  年生,现为首都经济贸易大学统计学院博士生导师、教授,研究方向为数理统计与运筹。

  年生,统计专业博士,现为海南大学经济与管理学院讲师,研究方向为应用数理统计。

本文链接:http://organikhijau.com/juleifenxi/143.html

相关推荐:

网友评论:

栏目分类

现金彩票 联系QQ:24498872301 邮箱:24498872301@qq.com

Copyright © 2002-2011 DEDECMS. 现金彩票 版权所有 Power by DedeCms

Top