區域自動站數據質量分析與評估

時間:2022-11-04 11:16:43

導語:區域自動站數據質量分析與評估一文來源于網友上傳,不代表本站觀點,若需要原創文章可咨詢客服老師,歡迎參考。

區域自動站數據質量分析與評估

常規氣象觀測數據,尤其是空間密度較高的區域自動站觀測數據,是制作天氣預報和氣候預測的基礎資料,其正確與否直接影響著天氣預報和氣候預測的質量[1-3]。近年來,國內外針對自動站觀測資料質量控制已作了大量研究,為自動站質量控制的業務應用奠定了良好的基礎[4-8]。氣象資料業務系統(簡稱MDOS)就是在此基礎上研發的一個集數據傳輸監控、質控信息處理與查詢反饋、基礎信息管理、產品制作與數據服務、元數據處理于一體的業務平臺。本研究基于MDOS中區域自動站小時數據的質控結果,重點就MDOS正式運行之后廣東省區域自動站小時數據的質量進行分析和評估,希望能夠為天氣應用提供可信性參考,以進一步提高中小尺度天氣系統的預報準確率和預警能力。

1考核區域自動站數據質量

1.1考核標準。按數據上傳時效考核與否,區域自動站分為考核站和非考核站。本研究首先利用國家氣象局業務內網的廣東省2015年7月至2018年12月考核區域自動站資料質量,對資料可用率、錯誤率、可疑率、缺測率進行統計分析。考核標準中所使用的質控碼是Z文件質控碼,Z文件質控碼及其描述如表1所示。可用率的分子對應于一體化的質控碼為0、3、4的數據個數;錯誤率對應于一體化數據質控碼2的個數;可疑率對應于一體化數據質控碼1的個數;可用率、錯誤率、可疑率分母均對應于考核要素個數;缺測率分子由3部分數據累加得到:1)考核要素中,質控碼為8的個數;2)考核要素中,質控碼為7(無觀測任務)的要素個數;3)快速質控文件未上傳的考核站的考核要素個數,分母對應于考核要素個數。1.2考核區域自動站總體質量評價。圖1反映了自MDOS正式運行以來,區域自動站的各月平均可疑率及錯誤率隨月份的分布情況。由圖1可知,考核區域站的錯誤率各月份普遍偏低,冬季(12月—次年2月)錯誤率接近于0,而可疑率冬季相對其他季節偏高,12月為013%。但是與缺測率橫向比較發現,二者對可用率的影響較小,貢獻最大月份也低于014%,相對而言,其影響可以忽略。圖1考核區域自動站疑誤率隨月份變化2015年7月至2018年12月廣東省考核區域自動站月平均可用率、缺測率的分布如圖2所示。由圖2可知,可用率存在明顯的季節變化趨勢,秋冬季節較好,數據可用率均達到975%以上。4月以后逐漸變差,7—10月是一年中數據可用率最差的時段,這與廣東省的汛期(4—10月)基本一致。結合各月平均缺測率隨月份變化曲線可知,考核區域站可用率隨月份變化的趨勢,與缺測率變化有明顯的對應關系,可用率與缺測率的皮爾遜相關系數高達-0999,通過了顯著性為1%的顯著性檢驗。導致區域自動站要素缺測的因素有移動通信故障、數據采集處理軟件故障、臺站儀器故障以及質控確認缺測4個方面,結合廣東省幾類故障情況,統計同時段區域站數據缺測率可以發現,通訊故障和數據采集處理軟件故障由于其影響范圍廣,是目前影響區域自動站數據缺測率的主要原因,約占所有缺測情況的75%以上。1.3考核區域自動站要素質量分析。區域自動站按觀測要素個數可分為4要素站(溫度、雨量、風向、風速)和6要素站(溫度、雨量、風向、風速、氣壓和相對濕度)2種。考核區域站各要素的正確率、錯誤率、可疑率及缺測率統計結果如圖3所示。由圖3可知,經過MDOS質量控制后的區域自動站考核要素的錯誤率及可疑率均較低,二者加起來也不到總量的05%,對各要素可用率影響較大的均為缺測率,氣溫、風速和降水的缺測率為2%左右,而氣壓和相對濕度相對較高,氣壓缺測率為50%,相對濕度缺測率為87%。考慮缺測率對數據可用率的影響較大,本研究進一步對各要素缺測率月分布情況進行分析,所得結果如圖4所示。由圖4可以看出,各要素2—5月缺測率普遍較高,4月達到最大值,此后缺測率開始降低,7—9月較低,10月以后缺測率分布又有抬升趨勢。氣溫、風速和降水的缺測趨勢基本一致,對各要素缺測率進行兩兩相關性檢驗,所得結果可以看出各要素缺測率相關性均較好,并且相關性均通過了顯著性為1%的相關性檢驗。

2MDOS質量評估系統中區域自動站數據質量

2.1各地市省級查詢與臺站反饋情況統計及時反饋率指疑誤信息的“查詢時間”與“反饋時間”之間的間隔未超過24h的數據個數占總下發疑誤數據的比例,它能夠量化反映臺站對疑誤信息的及時處理情況,目前在廣東省作為臺。站對于MDOS疑誤信息反饋的考核標準存在。2016—2018年,廣東省氣象局發往臺站的總疑誤信息查詢數為270766條,從反饋時效來看,及時反饋率為9307%、超時反饋率為682%、未反饋率為011%。利用MDOS質量評估規則,分別對全省21個地市反饋及時率進行統計可知,東莞、深圳、中山3市臺站及時反饋率較高,均達到98%以上,而汕頭、河源、茂名、清遠的及時反饋率較低,均低于90%。2.2區域自動站疑誤信息統計。MDOS平臺質量控制結果的疑誤類型分為錯誤、可疑、缺測3類,2016—2018年區域自動站共產生了978691條疑誤信息,系統判斷或人工判斷為錯誤的數據共計80252條,占據異常數據總體的82%;而可疑數據較多,占異常數據總體的622%;置缺測處理的疑誤信息共有289694條,占所有疑誤信息的296%。區域自動站數據的缺測過多,一是由于觀測設備故障或者通訊異常[9]導致的數據缺測;二是由于觀測數據經過質量控制后被標記為疑誤數據,經過反饋審核后確認為錯誤數據,但無可用數據替代,所以當成缺測處理。分析不同要素的疑誤信息條數的結果(圖略)可知,區域自動站產生疑誤信息較多的要素分別為氣壓(32%)、濕度(35%)、風(18%),其中,氣壓的疑誤信息較多主要是由于廣東省土地面積大約3/5是坡地和丘陵[10],受海拔高度影響,氣壓經常會提示未通過內部一致性檢查等疑誤信息;風要素疑誤信息共181681條,極大風速、最大風速出現時間不在觀測時間范圍內,存在較多錯誤。2.3區域自動站疑誤信息質控方法統計。由2016—2018年廣東省區域自動站產生的所有疑誤信息所采用的質控方法(圖略)可以看出,區域自動站數據的978691條疑誤信息,主要由于數據未通過內部一致性檢查及人工檢查得到,二者共占了所有疑誤信息引起原因的637%,快速質控(154%)、范圍值檢查(81%)及包含多重檢查在內的其他檢查(58%)也是發現疑誤信息的主要檢查方法;而未通過界限值檢查、持續性檢查、時變檢查、空間一致性檢查的疑誤信息共有67627條,占所有疑誤信息引起原因的69%。自MDOS在廣東省正式運行以來,區域站數據可疑率和錯誤率均較低,對數據可用性影響較小,各考核要素可用率主要受缺測率影響。而區域站各考核要素缺測率相關性較好,致使區域站數據缺測的的主要原因是通信故障和數據采集軟件故障。為了降低區域站數據缺測率,2018年下半年開始廣東省對新增區域站采集傳輸軟件進行了全面升級改造,2019年開始區域自動站通信系統也逐步進行升級,相信這些舉措都能有效改善區域自動站數據質量。

作者:侯靈 楊玉紅 陳曉慶 單位:廣東省氣象探測數據中心