如何利用深度學(xué)習(xí)優(yōu)化大氣污染物排放量估算?
編者按:全球碳排放問題亟待解決已是非常明確的科學(xué)共識,為了實現(xiàn)凈零排放這一全球性目標,微軟在2020年就提出了將在2030年實現(xiàn)碳負排放。近日,微軟亞洲研究院與清華大學(xué)的研究員們共同合作,在環(huán)境與地球科學(xué)領(lǐng)域國際知名期刊 Geoscientific Model Development 上發(fā)表了題為 “Exploring Deep Learning for Air Pollutant Emission Estimation” 的論文。文章詳細闡述了如何使用 AI 來幫助環(huán)境學(xué)家更精確地估算 NOx、SO2、VOC、一次 PM2.5 等污染物的排放量,并且把相對的估計誤差降低了20%,極大提高了估算精度。該方法同樣可以應(yīng)用于二氧化碳、甲烷等溫室氣體的排放估算中,為中國實現(xiàn)“碳達峰、碳中和”也提供了有價值的參考。
隨著經(jīng)濟發(fā)展和人口數(shù)量的飛速增長,人類活動排放的有害氣體嚴重損壞著公共健康與生態(tài)系統(tǒng)。排放清單的準確核算是有效模擬空氣污染控制政策的重要前提,但由于污染源繁多如居民生活、汽車尾氣、車間工廠等,并且其排放量不斷變化,因此基于傳統(tǒng)“自下而上”的排放源調(diào)查效率十分低下。而且傳統(tǒng)方法嚴重依賴于宏觀統(tǒng)計數(shù)據(jù),缺乏時效性及精度保障。這種不準確的排放清單也成為了當前影響空氣質(zhì)量預(yù)測與模擬精度的主要限制因素。
事實上,排放清單和空氣污染之間存在著一個對偶結(jié)構(gòu)??紤]到空氣污染物的濃度可以通過地面觀測、衛(wèi)星遙感等手段獲取,研究員們猜想,如果排放清單與污染物濃度之間有一個足夠準確的關(guān)系,那么就使用污染物濃度作為約束,來獲得更準確的排放清單?;诖耍④泚喼扪芯吭号c清華大學(xué)的研究員們共同合作,在環(huán)境與地球科學(xué)領(lǐng)域國際知名期刊 Geoscientific Model Development 上發(fā)表了題為 “Exploring Deep Learning for Air Pollutant Emission Estimation” 的論文。研究員們在論文中提出了一種基于對偶學(xué)習(xí)的新方法,利用 AI 任務(wù)的原始對偶結(jié)構(gòu)來獲取信息反饋和正則化信號,從而增強學(xué)習(xí)和推理過程。該方法的關(guān)鍵難點在于如何快速準確的量化從排放到濃度的高度非線性響應(yīng)關(guān)系。
Exploring Deep Learning for Air Pollutant Emission Estimation
論文鏈接:
https://gmd.copernicus.org/articles/14/4641/2021/gmd-14-4641-2021.html
模型代碼:
https://doi.org/10.5281/zenodo.4607127
為此,研究員們設(shè)計了基于神經(jīng)網(wǎng)絡(luò)的化學(xué)傳輸模型 NN-CTM,來準確表征從排放轉(zhuǎn)化到環(huán)境濃度中所經(jīng)歷的一系列大氣物理化學(xué)過程。與傳統(tǒng)的化學(xué)傳輸模型 CTM 相比,它是高效且可微分的,所以可基于濃度觀測值和模擬值之間的誤差梯度來更新排放清單。
圖1:基于對偶學(xué)習(xí)的排放清單估算框架圖
構(gòu)建以復(fù)雜神經(jīng)網(wǎng)絡(luò) 為基礎(chǔ)的化學(xué)傳輸模型
首先,研究員們構(gòu)建了以神經(jīng)網(wǎng)絡(luò)為基礎(chǔ)的化學(xué)傳輸模型 NN-CTM,以模擬大氣污染物的生成過程。同時結(jié)合光照、地理、氣象等信息,該模型可模擬出最終空氣中的污染物濃度??紤]到 CTM 中復(fù)雜的物理化學(xué)反應(yīng)、時空的對流擴散、地理特征等影響,研究員們選用了一個相對復(fù)雜的復(fù)合神經(jīng)網(wǎng)絡(luò)。如圖2所示,在該網(wǎng)絡(luò)中,研究員們用 CNN 實現(xiàn)了對地理位置的編碼,用 LSTM 循環(huán)神經(jīng)網(wǎng)絡(luò)實現(xiàn)了對時序變化信息的編碼,用 U-Net 實現(xiàn)了對空間信息的建模。
圖2:NN-CTM 模型結(jié)構(gòu)
實驗結(jié)果表明,訓(xùn)練好的 NN-CTM 模型可以很準確地復(fù)現(xiàn)大氣污染物的數(shù)值模擬結(jié)果,且誤差僅有3%左右,同時模擬速度可達到原數(shù)值模型的1000倍。
表1:NN-CTM 模型誤差
排放清單反向估算
研究員們基于訓(xùn)練好的 NN-CTM 來準確反映排放清單與污染物濃度之間的關(guān)系,進而在模型中輸入地表和衛(wèi)星觀測的污染物濃度數(shù)據(jù),通過誤差反向傳播的方法來估算新的排放清單。
圖3:排放清單反向估算
在本研究中,不同季節(jié)對排放清單的調(diào)整存在著很大的區(qū)別。表2列出了四個月內(nèi)機器學(xué)習(xí)方法估算的排放清單(N-Emis)較原始清單(P-Emis)的變化率。新的 N-Emis 結(jié)果表明:NOx 在1、10月份增加約3.5~4.0%,而7月份減少超過10%;NH3 的排放量在1月份增加,而在其他三個月減少,其中10月份的降幅最大;SO2 的排放量在所有月內(nèi)都減少約10%;VOC 的排放量也發(fā)生降低,且幅度比 SO2 更大,約20%,這可能與 CTM 對 O3 的高估有關(guān);一次 PM2.5 的排放量在所有月都增加不到5%。
表2:估算的排放清單相比原始的排放清單區(qū)別
為了進一步分析不同區(qū)域的排放變化,研究員們首先選取了5個典型區(qū)域:人口密集的京津冀地區(qū)(BTH)、長江三角洲地區(qū) (YRD)、珠江三角洲地區(qū)(PRD)、四川盆地地區(qū)(SCH) ,以及因缺少觀測數(shù)據(jù)而約束條件不足的中國西北部地區(qū)(NWC)。并計算了各典型區(qū)域內(nèi)5種排放物4個月的平均排放量在調(diào)整前后的變化,如圖4所示。
圖4:不同區(qū)域主要污染物排放量的變化
隨后,研究員們將使用調(diào)整后的排放清單(N-Emis)的污染物濃度模擬值與612個觀測站的數(shù)據(jù)進行對比,發(fā)現(xiàn)NO2、SO2、O3 和 PM2.5 濃度的平均絕對誤差(MAE)分別從7.39降低至5.91(20.03%)、3.64降低至3.22(11.54%)、14.33降低至11.56(19.33%)ppbv 和從18.94降低至16.67 (11.99%) μg m-3。結(jié)果證明了 N-Emis 的可靠性及本研究應(yīng)用機器學(xué)習(xí)方法的實用性。(注:括號內(nèi)數(shù)值為降低率。)
圖5:污染物誤差對比
本篇論文提出的方法也可以擴展到如 CH4、CO2 等溫室氣體的排放清單估算問題及其他基礎(chǔ)性研究問題上。除此之外,該方法還可以應(yīng)用到基于實時污染物觀測數(shù)據(jù)所構(gòu)建的實時排放清單監(jiān)測系統(tǒng)中。
可以看到,本文的研究成果對環(huán)境問題的改善,以及溫室氣體排放的控制有著十分重要的參考價值。在未來,微軟亞洲研究院的研究員們會繼續(xù)高度關(guān)注人類可持續(xù)發(fā)展中的諸多重要問題,探索 AI 技術(shù)在電池材料開發(fā)、吸碳材料開發(fā)、碳捕捉過程、碳封存過程等各個方面的應(yīng)用,持續(xù)以前沿技術(shù)推動可持續(xù)發(fā)展。
作者:黃麟(微軟亞洲研究院),劉松(清華大學(xué)),張佳(微軟亞洲研究院),邢佳(清華大學(xué))
*博客內(nèi)容為網(wǎng)友個人發(fā)布,僅代表博主個人觀點,如有侵權(quán)請聯(lián)系工作人員刪除。
可控硅相關(guān)文章:可控硅工作原理
比較器相關(guān)文章:比較器工作原理