عنوان مقاله:

رمزگشایی از ترافیک شهری تاثیرگذار بر کیفیت هوا با استفاده از یادگیری عمیق و فهرست آلاینده ها

Deciphering urban traffic impacts on air quality by deep learning and emission inventory

سال انتشار: 2022

رشته: محیط زیست - مهندسی کامپیوتر

گرایش: آلودگی هوا - هوش مصنوعی

دانلود رایگان این مقاله:

دانلود مقاله رمزگشایی ترافیک شهری

مشاهده سایر مقالات جدید:

مقالات ISI محیط زیست

مقالات ISI مهندسی کامپیوتر

1. Material and methods

1.1. Study area and datasets With development of environmental monitoring technology, we can obtain a large number of historical monitoring data for academic research. The iDeepAir model based on observation values connects multiple feature time series data to predict PM2.5 concentration. The study focuses on Shanghai region, which is one of the most developed area in China including 16 districts with different terrain and population density. The location information of monitoring points and road network are present in Fig. 1. The dataset used in this research consists of four parts: transportation-related data, air quality data, meteorological data and pollutant emission load related data. The detailed composition of the dataset and related statistical results are presented in Table 1. (1) Transportation-related data. This dataset includes two parts: Total numbers of both petrol and new energy vehicles and Traffic State Indexes (TSIs). Total numbers of petrol and new energy vehicles, which are from Shanghai Statistical Yearbook (http://tjj.sh.gov.cn) and Shanghai Traffic Comprehensive Annual Report. TSIs, which can be obtained from Shanghai Traffic Information Platform (http://www.jtcx.sh.cn), includes 68 traffic state indexes reflecting the real-time traffic status in different regions of the city. Regarding one specific region, this index is calculated with real-time road traffic status that is collected from intraregional road segments every 2 minutes (Text S1). (2) Air quality data. This data, which contains the hourly average monitored air quality data of Shanghai, is collected from the Real-time Air Quality Reporting System (http://219.233.250.38:8087/AQI/ siteAQI.aspx). The detailed elements of monitored data include Time, PM2.5, PM10, O3, SO2, NO2, CO, and all contaminant concentrations are recorded in micrograms per cubic meter (μg/m3). (3) Meteorological data. The meteorological data of Shanghai is collected from the platform of Weather Underground, by taking the Shanghai Hongqiao international Airport Monitoring Station as the reference point (https://www. wunderground.com/weather/ZSSS).The detailed categories of each meteorological record are shown in Table 1 and the sampling interval of meteorological data is 30 minutes. (4) Pollutant emission load related data. The annual total pollutant emission loads from the sectors of industry, resident, and transportation can be found from MEIC emission inventory. 

2. Results and discussion

2.1. Evaluations of iDeepAir on PM2.5 predictions In this subsection, the performance of iDeepAir on simulating the dynamic spatiotemporal generation and evolution processes of urban air pollution can be evaluated by measuring its accuracy on future PM2.5 concentration prediction (Fig. 3a). Besides, we compared our model with several alternative neural networks for sequence forecasting including ARIMA (Autoregressive integrated moving average (Box and Pierce, 1970)), GBDT (Gradient Boosting Regression Tree (Friedman, 2001)) and emerging deep learning based methods including LSTM (Long-short-term-memory network(Hochreiter and Schmidhuber, 1997)), GRU (Gated Recurrent Unit(Cho et al., 2014)), Seq2seq (Sequence to sequence (Sutskever et al., 2014)), DA-RNN (Dual-stage Attention-based Recurrent Neural network(Yao et al., 2017)), ADAIN (Neural Attention Model for Urban Air Quality Inference (Cheng et al., 2018)), Geo-MAN (Multi-level-attention-based RNN Model for Time Series Prediction(Liang et al., 2018)). These methods use the same dataset, but the input data could be adjusted for different models (Text S2). The results of models for PM2.5 concentration prediction in different time periods (+6 hr, +12rhr, +24rhr, +48 hr) are presented in Table 2. The best results are marked in bold. Obviously, the results demonstrate that our iDeepAir outperforms other alternative solutions in each prediction task, particularly in short-term predictions, iDeepAir has a great prediction effect with the least MAR and RMSE. Totally, these models tend to have greater inaccuracies in long-term prediction (+24 hr, +48 hr) but iDeepAir has a better prediction accuracy compared with other baselines. Specifically, compared to the baseline of ARIMA, iDeepAir can reduce the MAE from 25.355 to 12.283μg/m3 (Table 2 and Fig. 3b). Besides, we further discover that those hierarchical structured networks such as seq2seq, DA-RNN, ADAIN, and Geo-MAN, can significantly surpass those non-hierarchical structured networks, and this explains the superiority of our hierarchical iDeepAir which is carefully designed based on the prior knowledge of the dynamic formation process of PM2.5 (firstly the vehicle exhaust is discharged into the atmosphere to affect the pollutant concentration data of the atmosphere, and then the generation of PM2.5 is enhanced or offset under different meteorological conditions). To verify the effectiveness of each module and the robustness of the model, we conduct a series of ablation studies by removing and replacing each module of the integrated iDeepAir framework. It can be observed that existed modules can effectively improve the performance of the integrated model independently. These experiments verify the predictive ability and robustness of the algorithm under different time lengths, and reflects the practicality and stability (Fig. 3c).

(دقت کنید که این بخش از متن، با استفاده از گوگل ترنسلیت ترجمه شده و توسط مترجمین سایت ای ترجمه، ترجمه نشده است و صرفا جهت آشنایی شما با متن میباشد.)

1. مواد و روش ها

1.1. منطقه مطالعه و مجموعه داده ها با توسعه فناوری پایش محیطی، می توانیم تعداد زیادی داده پایش تاریخی را برای تحقیقات دانشگاهی به دست آوریم. مدل iDeepAir بر اساس مقادیر مشاهده، داده‌های سری زمانی چندگانه را برای پیش‌بینی غلظت PM2.5 به هم متصل می‌کند. این مطالعه بر منطقه شانگهای متمرکز است، که یکی از توسعه یافته ترین مناطق در چین شامل 16 منطقه با زمین و تراکم جمعیت متفاوت است. اطلاعات مکان نقاط پایش و شبکه جاده در شکل 1 موجود است. مجموعه داده مورد استفاده در این تحقیق شامل چهار بخش است: داده های مربوط به حمل و نقل، داده های کیفیت هوا، داده های هواشناسی و داده های مربوط به بار انتشار آلاینده. ترکیب دقیق مجموعه داده و نتایج آماری مرتبط در جدول 1 ارائه شده است. (1) داده های مربوط به حمل و نقل. این مجموعه داده شامل دو بخش است: تعداد کل خودروهای بنزینی و انرژی جدید و شاخص های وضعیت ترافیک (TSIs). تعداد کل خودروهای بنزینی و انرژی نو، که از سالنامه آماری شانگهای (http://tjj.sh.gov.cn) و گزارش جامع سالانه ترافیک شانگهای آمده است. TSI ها، که می توانند از پلتفرم اطلاعات ترافیک شانگهای (http://www.jtcx.sh.cn) به دست آیند، شامل 68 شاخص وضعیت ترافیک هستند که وضعیت ترافیک در زمان واقعی را در مناطق مختلف شهر منعکس می کنند. با توجه به یک منطقه خاص، این شاخص با وضعیت ترافیک جاده ای در زمان واقعی محاسبه می شود که هر 2 دقیقه از بخش های جاده های درون منطقه ای جمع آوری می شود (متن S1). (2) داده های کیفیت هوا. این داده‌ها که شامل میانگین ساعتی داده‌های کیفیت هوای شانگهای است، از سیستم گزارش‌دهی کیفیت هوای آنی (http://219.233.250.38:8087/AQI/ siteAQI.aspx) جمع‌آوری شده است. عناصر دقیق داده های نظارت شده شامل زمان، PM2.5، PM10، O3، SO2، NO2، CO، و تمام غلظت آلاینده ها بر حسب میکروگرم بر متر مکعب (μg/m3) ثبت می شود. (3) داده های هواشناسی. داده های هواشناسی شانگهای از سکوی Weather Underground با در نظر گرفتن ایستگاه نظارتی فرودگاه بین المللی شانگهای Hongqiao به عنوان نقطه مرجع (https://www. wunderground.com/weather/ZSSS) جمع آوری شده است. دسته بندی های دقیق هر رکورد هواشناسی در جدول 1 نشان داده شده است و فاصله نمونه برداری از داده های هواشناسی 30 دقیقه است. (4) داده های مربوط به بار انتشار آلاینده. مجموع بارهای انتشار آلاینده سالانه از بخش های صنعت، ساکن و حمل و نقل را می توان از فهرست انتشار MEIC پیدا کرد.

2. نتایج و بحث

2.1. ارزیابی iDeepAir بر روی پیش‌بینی‌های PM2.5 در این بخش، عملکرد iDeepAir در شبیه‌سازی فرآیندهای پویایی تولید مکانی-زمانی و تکامل آلودگی هوای شهری را می‌توان با اندازه‌گیری دقت آن در پیش‌بینی غلظت PM2.5 آینده ارزیابی کرد (شکل 3a). علاوه بر این، ما مدل خود را با چندین شبکه عصبی جایگزین برای پیش‌بینی توالی از جمله ARIMA (میانگین متحرک یکپارچه خودکار (باکس و پیرس، 1970))، GBDT (درخت رگرسیون تقویت‌کننده گرادیان (فریدمن، 2001)) و روش‌های مبتنی بر یادگیری عمیق از جمله LSTM مقایسه کردیم. (شبکه حافظه بلند مدت کوتاه (Hochreiter and Schmidhuber, 1997))، GRU (واحد بازگشتی دروازه ای (چو و همکاران، 2014))، Seq2seq (توالی به دنباله (Sutskever و همکاران، 2014))، DA- RNN (شبکه عصبی بازگشتی مبتنی بر توجه دو مرحله ای (یائو و همکاران، 2017))، ADAIN (مدل توجه عصبی برای استنتاج کیفیت هوای شهری (چنگ و همکاران، 2018))، Geo-MAN (توجه چند سطحی) مدل مبتنی بر RNN برای پیش‌بینی سری‌های زمانی (لیانگ و همکاران، 2018)). این روش ها از مجموعه داده یکسانی استفاده می کنند، اما داده های ورودی را می توان برای مدل های مختلف تنظیم کرد (Text S2). نتایج مدل‌های پیش‌بینی غلظت PM2.5 در دوره‌های زمانی مختلف (+6 ساعت، +12 ساعت، +24 ساعت، ساعت +48 ساعت) در جدول 2 ارائه شده است. بهترین نتایج با پررنگ مشخص شده‌اند. بدیهی است که نتایج نشان می‌دهد که iDeepAir ما در هر کار پیش‌بینی از سایر راه‌حل‌های جایگزین بهتر عمل می‌کند، به ویژه در پیش‌بینی‌های کوتاه‌مدت، iDeepAir با کمترین MAR و RMSE اثر پیش‌بینی عالی دارد. در مجموع، این مدل‌ها در پیش‌بینی بلندمدت دارای عدم دقت بیشتری هستند (+24 ساعت، +48 ساعت) اما iDeepAir در مقایسه با سایر خطوط پایه دقت پیش‌بینی بهتری دارد. به طور خاص، در مقایسه با خط پایه ARIMA، iDeepAir می تواند MAE را از 25.355 به 12.283μg/m3 کاهش دهد (جدول 2 و شکل 3b). علاوه بر این، ما بیشتر متوجه شدیم که آن شبکه های ساختار یافته سلسله مراتبی مانند seq2seq، DA-RNN، ADAIN و Geo-MAN، می توانند به طور قابل توجهی از آن شبکه های ساختاریافته غیر سلسله مراتبی پیشی بگیرند و این برتری iDeepAir سلسله مراتبی ما را توضیح می دهد که با دقت بر اساس طراحی شده است. دانش قبلی از فرآیند تشکیل دینامیکی PM2.5 (ابتدا اگزوز خودرو به اتمسفر تخلیه می شود تا بر داده های غلظت آلاینده اتمسفر تأثیر بگذارد، و سپس تولید PM2.5 تحت شرایط مختلف هواشناسی افزایش یا جبران می شود). برای تأیید اثربخشی هر ماژول و استحکام مدل، ما فرض می کنیم.