如何利用深度學習優(yōu)化大氣污染物排放量估算？

發(fā)布人：MSRAsia 時間：2021-09-20 來源：工程師

加入技術交流群
- 掃碼加入
  和技術大咖面對面交流
  海量資料庫查詢

編者按：全球碳排放問題亟待解決已是非常明確的科學共識，為了實現(xiàn)凈零排放這一全球性目標，微軟在2020年就提出了將在2030年實現(xiàn)碳負排放。近日，微軟亞洲研究院與清華大學的研究員們共同合作，在環(huán)境與地球科學領域國際知名期刊 Geoscientific Model Development 上發(fā)表了題為 “Exploring Deep Learning for Air Pollutant Emission Estimation” 的論文。文章詳細闡述了如何使用 AI 來幫助環(huán)境學家更精確地估算 NOx、SO2、VOC、一次 PM2.5 等污染物的排放量，并且把相對的估計誤差降低了20%，極大提高了估算精度。該方法同樣可以應用于二氧化碳、甲烷等溫室氣體的排放估算中，為中國實現(xiàn)“碳達峰、碳中和”也提供了有價值的參考。

隨著經濟發(fā)展和人口數量的飛速增長，人類活動排放的有害氣體嚴重損壞著公共健康與生態(tài)系統(tǒng)。排放清單的準確核算是有效模擬空氣污染控制政策的重要前提，但由于污染源繁多如居民生活、汽車尾氣、車間工廠等，并且其排放量不斷變化，因此基于傳統(tǒng)“自下而上”的排放源調查效率十分低下。而且傳統(tǒng)方法嚴重依賴于宏觀統(tǒng)計數據，缺乏時效性及精度保障。這種不準確的排放清單也成為了當前影響空氣質量預測與模擬精度的主要限制因素。

事實上，排放清單和空氣污染之間存在著一個對偶結構?？紤]到空氣污染物的濃度可以通過地面觀測、衛(wèi)星遙感等手段獲取，研究員們猜想，如果排放清單與污染物濃度之間有一個足夠準確的關系，那么就使用污染物濃度作為約束，來獲得更準確的排放清單。基于此，微軟亞洲研究院與清華大學的研究員們共同合作，在環(huán)境與地球科學領域國際知名期刊 Geoscientific Model Development 上發(fā)表了題為 “Exploring Deep Learning for Air Pollutant Emission Estimation” 的論文。研究員們在論文中提出了一種基于對偶學習的新方法，利用 AI 任務的原始對偶結構來獲取信息反饋和正則化信號，從而增強學習和推理過程。該方法的關鍵難點在于如何快速準確的量化從排放到濃度的高度非線性響應關系。

Exploring Deep Learning for Air Pollutant Emission Estimation

論文鏈接：

https://gmd.copernicus.org/articles/14/4641/2021/gmd-14-4641-2021.html

模型代碼：

https://doi.org/10.5281/zenodo.4607127

為此，研究員們設計了基于神經網絡的化學傳輸模型 NN-CTM，來準確表征從排放轉化到環(huán)境濃度中所經歷的一系列大氣物理化學過程。與傳統(tǒng)的化學傳輸模型 CTM 相比，它是高效且可微分的，所以可基于濃度觀測值和模擬值之間的誤差梯度來更新排放清單。

圖1：基于對偶學習的排放清單估算框架圖

構建以復雜神經網絡為基礎的化學傳輸模型

首先，研究員們構建了以神經網絡為基礎的化學傳輸模型 NN-CTM，以模擬大氣污染物的生成過程。同時結合光照、地理、氣象等信息，該模型可模擬出最終空氣中的污染物濃度?？紤]到 CTM 中復雜的物理化學反應、時空的對流擴散、地理特征等影響，研究員們選用了一個相對復雜的復合神經網絡。如圖2所示，在該網絡中，研究員們用 CNN 實現(xiàn)了對地理位置的編碼，用 LSTM 循環(huán)神經網絡實現(xiàn)了對時序變化信息的編碼，用 U-Net 實現(xiàn)了對空間信息的建模。

圖2：NN-CTM 模型結構

實驗結果表明，訓練好的 NN-CTM 模型可以很準確地復現(xiàn)大氣污染物的數值模擬結果，且誤差僅有3%左右，同時模擬速度可達到原數值模型的1000倍。

表1：NN-CTM 模型誤差

排放清單反向估算

研究員們基于訓練好的 NN-CTM 來準確反映排放清單與污染物濃度之間的關系，進而在模型中輸入地表和衛(wèi)星觀測的污染物濃度數據，通過誤差反向傳播的方法來估算新的排放清單。

圖3：排放清單反向估算

在本研究中，不同季節(jié)對排放清單的調整存在著很大的區(qū)別。表2列出了四個月內機器學習方法估算的排放清單（N-Emis）較原始清單（P-Emis）的變化率。新的 N-Emis 結果表明：NOx 在1、10月份增加約3.5~4.0%，而7月份減少超過10%；NH3 的排放量在1月份增加，而在其他三個月減少，其中10月份的降幅最大；SO2 的排放量在所有月內都減少約10%；VOC 的排放量也發(fā)生降低，且幅度比 SO2 更大，約20%，這可能與 CTM 對 O3 的高估有關；一次 PM2.5 的排放量在所有月都增加不到5%。

表2：估算的排放清單相比原始的排放清單區(qū)別

為了進一步分析不同區(qū)域的排放變化，研究員們首先選取了5個典型區(qū)域：人口密集的京津冀地區(qū)（BTH）、長江三角洲地區(qū) （YRD）、珠江三角洲地區(qū)（PRD）、四川盆地地區(qū)（SCH），以及因缺少觀測數據而約束條件不足的中國西北部地區(qū)（NWC）。并計算了各典型區(qū)域內5種排放物4個月的平均排放量在調整前后的變化，如圖4所示。

圖4：不同區(qū)域主要污染物排放量的變化

隨后，研究員們將使用調整后的排放清單（N-Emis）的污染物濃度模擬值與612個觀測站的數據進行對比，發(fā)現(xiàn)NO2、SO2、O3 和 PM2.5 濃度的平均絕對誤差（MAE）分別從7.39降低至5.91（20.03%）、3.64降低至3.22（11.54%）、14.33降低至11.56（19.33%）ppbv 和從18.94降低至16.67 (11.99%) μg m-3。結果證明了 N-Emis 的可靠性及本研究應用機器學習方法的實用性。（注：括號內數值為降低率。）

圖5：污染物誤差對比

本篇論文提出的方法也可以擴展到如 CH4、CO2 等溫室氣體的排放清單估算問題及其他基礎性研究問題上。除此之外，該方法還可以應用到基于實時污染物觀測數據所構建的實時排放清單監(jiān)測系統(tǒng)中。

可以看到，本文的研究成果對環(huán)境問題的改善，以及溫室氣體排放的控制有著十分重要的參考價值。在未來，微軟亞洲研究院的研究員們會繼續(xù)高度關注人類可持續(xù)發(fā)展中的諸多重要問題，探索 AI 技術在電池材料開發(fā)、吸碳材料開發(fā)、碳捕捉過程、碳封存過程等各個方面的應用，持續(xù)以前沿技術推動可持續(xù)發(fā)展。

作者：黃麟（微軟亞洲研究院），劉松（清華大學），張佳（微軟亞洲研究院），邢佳（清華大學）

*博客內容為網友個人發(fā)布，僅代表博主個人觀點，如有侵權請聯(lián)系工作人員刪除。