数理统计课程作业报告
题 目: 郑州市主要空气污染物相关性分析
课 程: 数理统计
学 院: 物流工程院 专 业: 物流工程专业 姓 名: 原上草 学 号: 666666666668
2015年 12月 20 日
- 1 -
目 录
一、研究背景 .................................................................................................................................. 4 二、污染物各月数据特征分析 ....................................................................................................... 4 三、郑州与杭州空气质量比较分析 ............................................................................................... 6 四、多元线性回归模型 ................................................................................................................... 7
4.1 PM2.5浓度相关性分析 ................................................................................................... 7 4.2建立模型 .......................................................................................................................... 8 4.3求解模型 .......................................................................................................................... 8 4.4残差分析 .......................................................................................................................... 9 4.5模型预测 .......................................................................................................................... 9
五、总结 ........................................................................................................................................ 10 参考文献 ........................................................................................................................................ 11 附件程序 ........................................................................................................................................ 12
2
摘要
本文选取了2014年 12 月至 2015年11月期间郑州市主要空气污染物浓度数据,首先分析了郑州市各个月空气中 PM2.5、PM10、CO、SO2和NO2的污染物浓度数据的特征值 , 探讨了空气污染物浓度的时间变规律 ;然后对比了郑州市和杭州市AQI指标,分析空气污染物的空间变化规律;最后采用MATLAB软件分析了PM2.5与其它主要空气污染物之间的相关性得到了
y350.3x9*14x3.99*x20.0的多元线性回归模型,3x2用12月份的
数据进行预测PM2.5浓度与真实值比较,结果表明该模型能较好的拟合PM2.5与其它污染物间相关性。
关键词:多元线性回归;特征分析;空气污染物;相关性
3
一、研究背景
随着城市社会经济快速发展、资源能源消耗和污染物排放总量的增长,城市的空气污染问题越来越突出,长期积累的环境风险开始出现。在2 0 1 2 年 2月,国家出台了新版《环境空气质量标准》(GB3095—2012),调整了部分污染物浓度限值,并增设PM2.5和O3浓度限值,对环境监测环境管理和环境评价提出了新的要求。城市环境空气质量的好坏与气象条件密切相关,研究和解决空气质量问题,通过分析各污染物浓度之间相关性,才可能准确掌握城市大气污染规律,对改善城市空气质量、提高人民健康水平有重要意义。本文重点分析了郑州市PM2.5浓度与其他主要空气污染物浓度的相关性。
二、污染物数据特征分析
郑州市属北温带性季风气候,冷暖适中、四季分明,春季干旱少雨,夏季炎热多雨,秋季晴朗日照长,冬季寒冷少雪。四季分明的特点在污染物的时空分布上也是表现的十分明显。本文对郑州市最近12个月空气中PM2.5、PM10、CO、SO2和NO2的污染物浓度特征值进行分析,主要污染物的变化情况如下所示:
表一:PM2.5浓度特征值
日期2014年12月2015年1月2015年2月2015年3月2015年4月2015年5月2015年6月2015年7月2015年8月2015年9月2015年10月2015年11月均值92.7160.7333132109.033385.2333390.675.359.3666758.5333365.668.298.63333PM2.5标准差48.4954670.2490552.2869842.5076329.5800432.4495532.809717.2597523.0068633.1829341.3137674.13703PM10标准差71.51394.977163.9759665.1800670.3228241.03960.5256738.2365340.7163656.1923462.56223103.1167中位数971481241108290726260615785众数6196749137791156572372870 表二:PM10浓度特征值
日期2014年12月2015年1月2015年2月2015年3月2015年4月2015年5月2015年6月2015年7月2015年8月2015年9月2015年10月2015年11月均值193.1333229.8667197.9286198.6174.3667157.8333144.1124.3667107.3333126.2333138.6333149.5333中位数182217188.5206167159148121105122117139众数1453492752151192032081217480139
4
表三:CO浓度特征值
日期2014年12月2015年1月2015年2月2015年3月2015年4月2015年5月2015年6月2015年7月2015年8月2015年9月2015年10月2015年11月均值1.9213332.1383331.6878571.5453331.381.5211.2023330.9941.0956671.2756671.2733332.131CO标准差0.4556810.7127930.4691360.3605530.2468330.29120.2729920.1584840.1787120.2787310.355690.965741中位数1.851.951.71.541.361.431.210.981.131.171.231.91众数1.381.781.941.541.361.371.30.861.171.161.211.33 表四:NO2浓度特征值
日期2014年12月2015年1月2015年2月2015年3月2015年4月2015年5月2015年6月2015年7月2015年8月2015年9月2015年10月2015年11月均值61.674.1666751.7142957.7666750.345.5666743.6666740.243.3666753.762.4333361.6NO2标准差17.3850519.8697117.9281414.6097812.9412810.0222512.4078.672212.2759517.051217.6194721.98272众数7151.5585145423842526256众数677072704254463531495472 表五:SO2浓度特征值
日期2014年12月2015年1月2015年2月2015年3月2015年4月2015年5月2015年6月2015年7月2015年8月2015年9月2015年10月2015年11月均值74.9333374.1666757.280.429.725.9333317.133337.333333714.733.0333330.7SO2标准差31.6595833.9382623.7700518.211.410969.1721.5139665.1532083.2863356.47121814.7681717.69962众数726653.54030261556153124众数3813260601712134571639 为了方便于直观的分析空气污染物浓度与时间之间的变化规律,将以上表格数据中主要污染浓度的月平均值作折线图如下:
5
2502001501005002014年12月浓郑州市各月空气污染物pm2.5pm10CO2015年1月2015年2月2015年3月2015年4月2015年5月2015年6月2015年7月2015年8月2015年9月2015年10月2015年11月NO2SO2月份 图1:污染物浓度月平均值
从图1中可以看出郑州市主要空气污染物浓度在十二月至来年二月份左右达到最大,然后污染物浓度开始下降,到六月至八月份降到最低。郑州市区雾霾天气情况随季节变化比较明显,在冬季,气象条件将更加不利于污染物扩散。进一步分析PM2.5和PM10的变化趋势可预测郑州市雾霾天气大多发生在每年的十二月份至来年的二月份,而每年六月份至八月份雾霾天气出现次数较少。
三、郑州与杭州空气质量比较分析
本文分别选取了郑州市和杭州市最近12个月的空气污染浓度数据,以AQI为指标,将空气污染程度划分为优、良、轻度污染、中度污染、重度污染和严重污染六个等级,下图是对两城市空气质量等级的天数进行比较:
空气质量等级郑州市23080121231237673杭州市13232150 图2:郑州市与杭州市空气质量等级
由上图可以看出杭州市空气质量等级主要是优和良,占总天数77.3%,中重度污染占比3.2%,郑州市空气质量优良的比例是36.6%不及杭州市的一半,中重度以上污染占比30.1%。杭州市空气质量等级明显优于郑州市,对于两城市空气质量的差别进行分析得出两方面的主要影响因素,一人为因素影响:郑州市能源消耗以燃煤为主,占整个能源消耗量的73%。其中,相当一部分单位的燃煤排放没有达到国家标准,然而即使排放全部达标,因燃煤基数过大,也将对大气环境造成极大危害。二气候地理因素影响:通过百度地图可以看出郑州位于秦岭以北,
6
属于北温带性季风气候,天气干燥少雨,本地产生的污染物不易扩散,且容易受到北方气流影响,冬季冷空气带来大量污染物被阻隔在秦岭一带,污染物停滞在华北平原,造成郑州空气污染越发严重。杭州位于秦岭以南属于亚热带季风气候,降水充沛,受东南季风影响,从海上吹来的温湿气流给杭州带来了新鲜的空气的同时也使杭州本地产生的污染更容易扩散。
图3:郑州市与杭州市地理位置关系
郑州市空气污染的预防与控制也可以从两个方面讨论:一方面对于本地产生的污染问题,可以提高能源利用率、发展新型清洁能源严查排放不达标车辆、提倡步行与骑行等来减少污染物的产生。另一方面对于北方气流带来的污染物可以通过与周边省市进行联防联控,减少空气流通带来的污染。
四、空气污染物浓度相关性分析
4.1 PM2.5浓度相关性分析
PM2.5指环境空气中空气动力学当量直径小于等于 2.5 微米的颗粒物。它能较长时间悬浮于空气中,其在空气中含量浓度越高,就代表空气污染越严重。本文对郑州市最近12个月天气数据分析,研究空气中PM2.5浓度与PM10、CO、NO2、和SO2浓度是否相关。其散点图如下所示:
图4:PM2.5与PM10相关性 图5:PM2.5与CO相关性
7
图6:PM2.5与NO2相关性 图7:PM2.5与SO2相关性
由图4-7可知PM2.5浓度随着PM10、CO、NO2、和SO2浓度增加而增加,成线性相关。
4.2建立多元线性回归模型
对PM2.5浓度与PM10、CO、NO2、和SO2浓度进行多元线性回归,设PM2.5浓度为y,则
y01*x12*x23*x34*x4+
其中:
x1、x2、x3、x4是回归变量代表PM10、CO、NO2、和SO2浓度,0,1,2,3,4是回归系数,是随机误差应大致服从均值为0的正态分布。 4.3求解模型
直接利用matlab工具箱中的命令regress求解,使用格式为:
[b,bint,r,rint,stats]=regress(y,x,0.05)
其中y为pm2.5浓度,置信度水平设为0.05。输出b为的估计值,bint为b的置信区间,stats为回归模型的检验统计量,有4个值,第一个是回归方程决定系数R2,第二个是F统计量,第三个是与F统计量对应的概率值p,第四个是剩余方差s2。
得到模型的回归系数估计值及其置信区间、检验统计量的结果如下:
8
表六:多元线性回归计算结果
参数 参数估计值 -35.00 0.39 43.99 0.032 -0.16 参数置信区间 [-43.51,26.49] [0.34,0.44] [37.86,50.11] [-0.178,0,241] [-0.28,-0.04] 0 1 2 3 4 2R20.7968 F356.80 p0.0001 s2583
表六显示,R =0.7968指因变量y(PM2.5浓度)的79.68%可以由模型确定,F检验值远超过F检验的临界值,p远小于置信水平0.05,拟合从整体来看是可用的。所以拟合方程为:
y350.39*x143.99*x20.032*x30.16*x4
4.4残差分析
作出残差图,从图 1可以看出,红线为异常数据,除少数几个异常数据外,其余数据的残差离零点均较近,且残差的置信区间包含零点,这说明回归方程y=-35+0.39*x1+43.99 x2-0.032x3+0.16x4能较好地符合原始数据。
图8:残差图分析图
根据以上公式,空气中PM2.5浓度与pm10、CO、NO2、和SO2浓度具有线性相关性,具有一定的现实意义,例如当某个监测站pm2.5检测仪出现故障时,可利用其它污染物浓度推出。 4.5模型预测
为检验所得多元线性回归模型的可靠度,本文利用2015年12月份的污染物浓度数据进行预测PM2.5的浓度与真实PM2.5浓度进行对比,预测值与真实数据对比如图五,其中蓝色星点为PM2.5浓度真实值,红色曲线为PM2.5浓度预测值,对比发现预测曲线全部在真实值附近。
9
图9:预测浓度与真实浓度的对比
五、总结
文中利用多元线性回归方法分析PM2.5浓度与主要污染物浓线性相关性,得到回归方程y350.39*x143.99*x20.032*x30.16*x4,并通过检验方法证明所建立的模型有一定的理论意义和实用价值,体现了多元线性回归模型广阔的应用前景。
10
参考文献
[1]陈杜甫,高祎楠,张稳定,姜楠,燕启社,张瑞芹.郑州市大气PM2.5污染传输影响研究—中国环境科学学会学术年会(2015)光大环保优秀论文集[C].郑州:郑州大学,2015.234-244.
[2]王佳.郑州市PM2.5污染特征及其源解析研究[D].郑州:郑州大学,2015.5-10.
[3]毕丽玫,史建武,刘意,邓昊,盛涛.昆明城区PM2.5与常规大气污染物及气象因素的相关性分析—中国环境科学学会学术年会论文集[C].昆明:昆明理工大学.4499-4505.
[4]孟小峰.重庆主城区空气质量时空分布及其影响因素研究[D].重庆:西南大学,2011.
[5]蒋维嵋.空气污染气象学教程[M].北京中国气象出版社,2004. [6]丁.实用污染气象学[M].北京:气象出版社,1981. [7]气象网站 天气后报:http://www.tianqihoubao.com/
11
附件程序
%%多元线性回归程序
clear
clc %清除所有数据
x=xlsread('222.xls','sheet12','e2:i370'); %读取郑州市污染物浓度数据 y=x(:,1);%PM2.5浓度 x1=x(:,2);%PM10浓度 x2=x(:,3);%CO浓度 x3=x(:,4);%SO2浓度
x4=x(:,5);%NO2浓度
x=[ones(369,1) x1 x2 x3 x4];
[b,bint,r,rint,stats]=regress(y,x,0.05); %多元线性回归函数 %%预测程序 clear
clc %清除所有数据
x=[];%复制2015年12月的天气污染数据 x1=x(:,2); x2=x(:,3); x3=x(:,4); x4=x(:,5); y=x(:,1);
Y= -35+0.39*x1+43.99*x2-0.032*x3-0.16*x4; X=1:17;
plot(X,Y,'r',X,y,'b*')
12