cookieOptions = {...}; · 使用城市公車和機器學習,進行即時天氣監測和預測 - 3S Market「全球智慧科技應用」市場資訊網

3S MARKET

3S MARKET
2022年9月21日 星期三

降雨預測 - 使用 Kaggle 數據集建構用於降雨預測的機器學習模型 



MDPI

摘要

準確的天氣數據對於規劃我們的日常活動非常重要。為了監測和預測天氣資訊,提出了一種兩階段天氣管理系統,它結合了資訊處理、公車移動性、感測器和深度學習技術,提供公車和車站的即時天氣監測,並透過預測實現天氣預報。基於公車的感測測量,這項工作結合了本地資訊處理和行動公車的優勢,以增加測量覆蓋範圍,並提供新的感測數據。在第一階段,給定天氣感測數據,使用測試環境的溫度、濕度和氣壓數據,對長短期記憶(LSTM)模型和多層感知器(MLP)模型,進行訓練和驗證。在第二階段,將訓練好的學習模型,應用於預測天氣資訊的時間序列。


為了評估系統性能,我們將預測的天氣數據,與平台中觀測站環境保護署(EPA)和中央氣象局(CWB)的實際感測測量值進行比較,以評估預測準確性。結果顯示,所提出的系統在天氣監測方面,具有可靠的性能,並且透過訓練的模型,可以很好地預測一日天氣預報。


一、簡介

天氣在人們的生活中扮演著重要的角色。透過天氣監測,可以進行數據分析和預報,以提供有用的天氣資訊[ 1 ]。在預報方面,由於影響天氣變化的因素很多,準確預報天氣具有挑戰性[ 2 ]。考慮系統運行和處理技術,現有的氣象監測和預報系統,可以分別從系統架構和資訊處理的角度來描述。


從系統架構的角度來看,氣象監測站可以是靜態的,也可以是行動的。利用固定氣象站提供的資訊,有一些模擬軟體使用數值模擬,來定義每個網格中的溫度[ 3 ]。每個網格的估計演算精度,與分佈在城市中的氣象站數量成正比。在 Lim 等人。[ 4 ],國家天氣感測器網格 (NWSG) 系統,目的在實時監測城市分佈式區域的天氣資訊,其中氣象站設置在學校中。在蘇塔爾 [ 5],開發了一個系統來監測溫度、濕度和光照強度等天氣參數。但是,沒有考慮行動性問題和通信協議。


行動氣象站安裝在車輛上,不斷行駛在特定區域收集數據,並透過有線或無線技術,將數據發送到不同的接收器,從而實現比靜態觀測更好的覆蓋平衡。在 Foina 等人。[ 6 ],城市公車被用作行動氣象站,透過車輛行駛的路徑收集數據。該系統具有三個交互層次,設備整合在總線、終端電腦和系統電腦中。雖然 PeWeMos 系統 [ 6] 認為,它可以監測一個區域內的非常精細的細節和天氣變化,並在足夠長的時間內,提供非常精細的天氣資訊和變化,對感知到的天氣數據的解釋,以及公車、公車站的合作,和乘客進行天氣監測,沒有得到解決。Hellweg 等人。[ 7 ] 使用浮動汽車數據,進行道路天氣預報,目度在提高天氣觀測網路,和預測模型的解析度。


初步結果顯示,原始信號的偏差校正和品質控制,是實現安全自動駕駛的關鍵問題。考慮到通信管道對資訊品質的影響,天氣對無線電鏈路性能的影響已經在 [ [ 8 ],它分析了幾個天氣變量,與室外無線局域網中控制幀的行為之間的相關性。基於公車資訊管理系統,我們之前的工作[ 9 ]結合本地資訊處理和公車行動性的優勢,提出了一種即時天氣監測系統,包括天氣監測系統和公車與車站之間的管理子系統。 圖 1顯示了系統模型,包括信號、控制和通信組件。


資訊處理的角度來看,由於預測是一個非常重要的分析主題,機器學習為系統提供了從經驗中學習和改進的能力 [ 10 , 11 ]。此外,透過機器學習,可以在不了解物理過程的情況下,實現數據分析和預測(例如,應用過去的數據來預測未來的數據 [ 12 ])。讀者可以參考[ 13 ]進行完整的討論。


在文獻中,已經提出了許多降雨和天氣預報的預測模型。例如,Parashar [ 14 ] 提出了一個監測和報告天氣狀況的系統,以便提前通知採取相關措施,以減少可能的損害。一個 Arduino Mega 與一些天氣感測器一起使用,在 LCD 螢幕上顯示感測值,並應用機器學習技術訓練模型和預測,並將預測結果放到網站上。它主要監測天氣狀況,並預測第二天的平均、最高和最低溫度,而不提供更詳細的資訊,例如每小時的天氣狀況(例如溫度、濕度和氣壓)。


辛格等人。[ 15 ] 開發了一種可用於偏遠地區的低成本,便攜式天氣預報系統,透過數據分析和機器學習算法,來預測天氣狀況。系統架構以樹莓派為主要組件,配合溫度、濕度、氣壓感測器獲取感知值,然後根據隨機森林分類模型進行訓練,預測是否會下雨。請注意,儘管 Singh 等人的系統硬體。[ 15 ] 和建議的天氣監測和預報系統相似,Singh 等人的系統。[ 15 ] 只描述了降雨的概率。在 Varghese 等人。[ [ 16 ],使用 Raspberry Pi 和天氣感測器,使用線性回歸機器學習模型收集、訓練和預測數據,以透過平均絕對誤差和中值、絕對誤差進行評估。


本工作不再只考慮資訊處理的角度,而是同時採用了系統架構和資訊處理的角度。在陳等人的系統架構的基礎上。[ 9],一對公車站和一個公車,Gateway 和伺服器可以作為一個組,來動態操作控制系統和通信系統,從而擴展系統以應用機器學習算法收集的數據,以提供天氣監測和預測。請注意,鑑於壓力、溫度和濕度等基本氣象要素,這項工作的重點是預測未來 24 小時的溫和天氣變化的溫度、濕度和壓力。對於惡劣天氣的預測,為了加快訓練過程,提高預測精度,Zhou等人。[ 17] 聲明預測器應包含主要環境條件,其中包括氣壓、溫度、位勢高度、濕度和風等氣象要素,以及一些對流物理參數(即,包括額外和先進的感測器設備)來構建預測系統。


這項工作的主要貢獻和特點是:(1)提出了一種具有基本氣象要素的新型即時天氣監測和預測系統;(2) 開發資訊處理方案,透過公車資訊系統提高管理效率;(3) 構建機器學習模型,分析天氣變化趨勢,預測未來24小時的天氣。 表 1 描述了現有系統和擬建系統的性能比較,顯示除了溫度預測外,擬建系統還能夠透過訓練有素的系統,為一日天氣預報,提供基本氣象要素(例如溫度、濕度、壓力)的預報。



本文的其餘部分組織如下: 第 2 節描述了系統架構,包括資訊處理、數據傳輸/接收過程、系統組件和系統的實現。 第 3 節介紹機器學習模型和輸入數據格式。 第 4 節描述了每個處理塊的實驗結果,並描述了不同預測模型的性能比較。最後,在第 5 節總結這項研究 。




二、系統說明

2.1. 概述

所提出的系統是透過資訊管理系統、傳輸技術、信號處理和機器學習技術開發的。考慮到系統組件(即節點、Gateway、伺服器和客戶端)之間的操作, 圖2 顯示了通信和數據傳輸/接收的整個系統框圖。各系統組件的功能描述如下:



  1. 節點:節點主要用於公車和公車站,透過帶有感測器(如溫濕度感測器、近場通信(NFC)模組等)的樹莓派獲取天氣資訊。總線上的節點將資訊,傳遞給相鄰的總線站上的節點,然後總線上的節點將數據發送到Gateway。
  2. Gateway:Gateway 是一個中繼站,用於將數據上傳到伺服器進行下一步處理,並連接兩個網路,一個由節點組成,另一個使用網路協議套件。
  3. 伺服器:伺服器是網站後端的數據中心和控制平台,接收 Gateway 傳來的數據,對數據進行分類,存入數據庫,然後將數據應用到機器學習預測和模型訓練的整合中。伺服器傳遞站點請求的數據,並以所需的資訊響應客戶端。借助當前和以前的天氣資訊,所提出的系統能夠執行未來 24 小時的溫度、濕度和氣壓預測(詳見 第 3 節)。
  4. 客戶端:用戶可以透過 PC 和行動設備瀏覽網站,獲取當前天氣資訊或預報,以規劃日常活動。

2.2. 系統架構和操作

圖 3 為系統架構,由三大部分組成: 圖 3 A 總線-站操作, 圖 3 B 站- Gateway -伺服器操作, 圖 3 C 伺服器-客戶端操作,介紹了各部分之間的消息流,包括數據收集、資訊共享、數據處理和數據儲存。



2.2.1. 巴士-巴士站營運

硬體/軟體實施

在公車站街區(即 A 街區)中,Raspberry Pi 3 Model B+ [ 18] 用於帶有多個氣象感測器和無線通信模組的公共汽車和車站,以實現數據的收集和傳輸。公車和公車站的硬體結構,包括樹莓派和感測器(即溫度、濕度、氣壓、PM 2.5、紫外線和雨滴感測器)。在這裡,我們簡要探討了無線技術在系統操作中的使用。為模擬巴士、巴士站、乘客之間的互動,應用近場通訊(NFC)模組,模擬台灣巴士上的 EasyCard 系統,統計人數,並在巴士站感應信號請求停車處。


總線與站台使用無線通信模組 XBee Serial 2 (S2C)進行數據傳輸。該站還使用了用於與 Gateway 進行無線傳輸的 LoRa 模組。由於 Raspberries 只有數字輸入,一些感測器需要與 MCP3008 配對,才能轉換類比信號。當前的天氣資訊也可以透過公共汽車和車站的監視器查看。在 Linux 系統上運行樹莓派,實驗中使用 Python 編程獲取感測值並處理數據,並在公車站樹莓派上搭建 MySQL 數據庫記錄數據。


通訊操作

圖 4(沒有虛線框)顯示了總線感測器數據的收集、儲存和傳輸過程。當 NFC 模組從天氣感測器獲取乘客人數或測量值時,數據將儲存在 MySQL 數據庫中。數據經過處理後,會透過 XBee 模組傳送到公車站,然後用戶可以透過螢幕查看天氣資訊。在公車站,公車透過 XBee 模組發送的數據儲存在數據庫中,透過 LoRa 無線技術轉發到 Gateway。 圖 4(虛線框)顯示了公車站的數據傳輸/接收過程。



2.2.2. 公車站- Gateway -伺服器操作

LG01 LoRa Gateway [ 19 ] 用作站和伺服器之間的中繼站。場景將數據傳輸到 Gateway,然後 Gateway 透過 LoRa 無線技術,將數據上傳到伺服器,將 LoRa 無線網路橋接到 IP 網路。軟體實現方面,在 Arduino 開發環境中編寫 C 程序,讓 Gateway 在公車站接收 LoRa 發送的信號,然後透過 HTTP 網路協議上傳到伺服器。


2.2.3. 伺服器-客戶端操作

使用 Windows 7 開發環境和 Django 網路框架,Python 和 JavaScript 用於編程,SQLite 用於設置數據庫。所提出的天氣系統的軟體實現,包括一個網路伺服器和一個數據庫,以便執行數據處理、儲存和網站顯示。當數據記錄到數據庫時,會同時導出一個 Excel 文件,其中包含時間、溫度、濕度和氣壓值。之後,使用 Jupyter Notebook 環境中的 Python 和學習模型進行天氣預測,並將結果上傳儲存,預測資訊顯示在網站上。表 2 詳細記錄數據庫中的所有感測器資訊,包括時間、檢測值和五個感測器(即紫外線感測器、雨滴感測器、溫濕度感測器、氣壓感測器和 PM 2.5 感測器)。請注意,Pred temp 行是一組濕度、溫度和壓力的預測值。表 3。描述了每個感測器的測量單位。




2.3. 機器學習

為了建立一個預測模型,這項工作應用了台灣環境保護署 (EPA) 和中央氣象局 (CWB) 的開源數據 [ 20],台中天文台近六年每小時約 50,000 次測量,作為訓練數據源。每次測量都包括溫度、濕度和氣壓,測量間隔為 1 小時。在訓練模型之前,首先,處理數據集。接下來,按照特定的格式組織數據,然後進行預測模型訓練。因此,首先從開源數據集中取出溫度、濕度和氣壓值。接下來,將測量數據分為訓練數據集、測試數據集和驗證數據集,然後取三個數據集的平均值和標準差。最後,數據標準化。


3.輸入數據格式

為了檢驗預測性能,測量數據通過不同的格式(即G1、G2、G3和G4)進行處理,如 表4所示。讓 表示一天中什麼時間的傳感值,其中 In 表示輸入數據,D 表示當前日期,T 表示 24 小時格式的時間。將前一天表示為 D-1。例如, 代表當天的 23:00 和 表示前一天的 22:00。每種類型的輸入數據格式都由一個時間線表示,其中每個數據包含三個值:溫度 t、濕度 h 和壓力 p。假設要預測 24:00 的天氣數據(即 圖 5的紅色部分),則考慮 G1 格式來評估相鄰時間段(即輸入數據( 圖 5的灰色部分)) 將包含昨天 21:00 到 24:00 的四個條目和今天 23:00 的數據)。G1 格式的基本原理是探索較短相鄰時間段的數據特徵。對於 G2、G3 和 G4 格式,我們調查了數據格式在中等時間段(例如,過去 12 小時的 G2)和長時間段(例如,過去 24 小時的 G3 和過去的 G4)的影響48 h)關於預測性能。




學習模型架構

本小節描述了這項工作中使用的學習模型:長短期記憶 (LSTM) 模型和多層感知器 (MLP) 模型。對於 LSTM [ 21 , 22]模型,它使用三個門來調整先前存儲的數據:輸入門、輸出門和遺忘門,並改進了遞歸神經網絡(RNN)梯度消失的問題。遺忘門用於決定哪些信息將從單元狀態中丟棄。輸入門決定了向細胞狀態添加了多少新信息。輸出門基於單元狀態來確定邀請輸出什麼值。LSTM結合了三個門的結構來保護和控制信息。因此,LSTM 在長時記憶任務中的表現優於 RNN。在 圖 6,上面的水平線是細胞的狀態。選擇性地讓消息通過三個門。遺忘門用於確定哪些消息通過單元格,然後進入輸入門,決定向單元格狀態添加多少新消息,最後通過輸出門決定輸出消息。



這項工作將 LSTM 與遺忘門一起應用。在 圖 6中, 和 表示當前時刻的單元狀態和輸出值,以及 和 表示細胞狀態和前一時刻的輸出值。表示 , , , 分別為遺忘門的激活向量、輸入/更新門的激活向量、輸出門的激活向量、單元輸入激活向量。讓 和 分別是權重矩陣和偏置向量參數,需要在訓練過程中學習。讓 和 分別是 sigmoid 函數和雙曲正切 (Tanh) 函數。

第一步是決定通過稱為遺忘門層的 sigmoid 層從單元狀態中丟棄哪些信息。它看著 和輸入向量 , 並為單元狀態中的每個數字輸出一個介於 0 和 1 之間的數字 . 請注意,1 代表“完全保留這個”,而 0 代表“完全擺脫這個”。因此,遺忘門的激活向量由下式給出

下一步是決定在單元狀態中存儲哪些新信息。輸入門層和 Tanh 層用於創建狀態更新。


然後,新的細胞狀態 由更新

最後,根據單元狀態,我們需要決定輸出什麼。首先,我們運行一個 sigmoid 層,它決定輸出的單元狀態的哪些部分。然後,我們將細胞狀態通過並乘以 sigmoid 門的輸出,得到 MLP [ 23 ] 模型由至少三層節點(輸入層、隱藏層和輸出層)組成。在 MLP 模型中,一些神經元使用非線性激活函數來模擬動作電位的頻率,或生物神經元的放電。由於 MLP 是全連接的,因此一層中的每個節點都以一定的權重連接到下一層中的每個節點。在每個數據處理完成後,通過調整連接權重在感知器中執行學習,連接權重取決於數據輸出中與結果相比的錯誤數量。





LSTM 和 MLP 模型架構與 TensorFlow 和 Keras 配對用於模型訓練。LSTM 參數回溯設置為 5。Adam 優化算法用於訓練網絡。損失值通過均方根誤差 (RMSE) 進行評估。激活函數使用 Tanh 和縮放指數線性單位 (Selu) 函數。表5總結了每一層的單元和激活函數 . 參考上面的LSTM層,我們可以通過調整cell個數,輸入維度,激活函數來匹配數據。時間分佈的dense layer是將dense layer逐漸應用到序列中。密集層用於激活神經網絡中的神經元。對於 MLP 參數,使用正態分佈初始化權重。激活函數使用整流線性單元 (Relu) 函數。 表 6總結了MLP模型每一層的單元和激活函數,其中flatten層是將高維矩陣展平成二維矩陣,保留第一個維度,然後將其余維度的值相乘得到矩陣的第二維。訓練模型時,我們可以判斷模型是否過擬合,這樣可以根據每次訓練的損失值和準確率來調整模型。通過測試不同組合和層的參數值,最終找到適合數據的模型。

傳感器採集的氣象數據按照上述數據處理步驟和格式進行處理。所提出的模型主要側重於預測未來一天的天氣狀況,包括溫度、濕度和氣壓。即,假設當前時間為0:00,進行天氣預報,則獲得未來24小時的預測溫度、濕度和壓力值(即從1:00到24:00的天氣預報)。因此,在 1:00 執行更新的 24 小時天氣預報(即從 2:00 到第二天 1:00 的天氣預報),傳感器在 1:00 收集的天氣數據將添加到原始數據中數據集形成一個新的輸入數據集,用於接下來 24 小時的順序預測。最後,通過均方根誤差 (RMSE)、平均絕對誤差 (MAE) 和百分比誤差,通過比較預測的天氣數據和測量值來評估系統精度,如 (1)-(3) 所示。因此,參照上述訓練模型,可以實現天氣預報。



整體預測模型訓練過程將原始數據經過數據處理後分為訓練集、驗證集和測試集,然後進行模型訓練。完成模型評估後,系統根據評估結果調整參數,然後繼續訓練,最終得到預測模型。

數據處理完畢後,使用訓練好的預測模型進行預測。隨著預測的完成,將預測值添加到數據集中形成新的數據集,然後進行下一次預測,直到得到最終結果,即完成預測任務。

4. 實驗結果

為了評估系統性能,本節探討了公交車和公交車站之間的信息處理,並討論了學習模型的預測性能。

4.1。公共汽車和汽車站之間的信息處理

圖 7(左)說明了總線實驗模塊,包括傳感器、收發器、MCU 板和 NFC 模塊。 圖 7(右)描繪了公交車站實驗模塊,包括傳感器、收發器、MCU 板、NFC 模塊和 LoRa 模塊。 圖 8分別顯示了公交車和公交車站的天氣信息,每分鐘更新一次。




以下兩個實驗是為了評估數據接收的穩定性,考慮從總線傳輸數據和在總線站接收數據,傳輸時間間隔為 1.5 s。第一個實驗旨在確定發射器-接收器對之間可接受的傳輸範圍。 圖 9(左)顯示,對於一對靜態發射器和接收器,97% 數據接收率的傳輸範圍邊界約為 150 m。此外,數據丟失場景發生在 200 m 的傳輸範圍內。對於更遠的傳輸範圍,例如 240 m 的距離,接收率下降到零。



由於總線移動,第二個實驗探討了移動性對數據接收性能的影響。根據從第一個實驗開始的傳輸範圍(大約 240 m 的距離),檢查了公共汽車在到達和離開時向公共汽車站移動的位置的數據接收。在這種情況下,考慮上下車的乘客。 圖 9(右)顯示了總線在不同通信範圍內以 30 公里/小時的速度接收數據的速率。請注意,可接受的接收範圍約為 150 m,接收率為 60%。在這項工作中,我們使用了一個室外視距通信範圍高達 100 m 的 XBee 模塊。100 m 以上距離的接收變化是因為從各種周圍物體反射的信號(多徑接收)在接收點會聚。因此,開放空間中可能存在的障礙物(例如樹木、人員和車輛的移動)會導致通信質量發生變化。同時,根據周圍物體的相對位置,信號可以在接收點被放大和衰減。讀者可參考[ 24] 用於測試 ZigBee 技術中的通信範圍。除了探索接收速率之外,實驗 2 的結果還可用於確定傳輸時間間隔,同時考慮傳輸範圍和總線速度。以時速30km/h的公交車為例,公車與公車站的通信時長約為30s,建議可以將傳輸時間間隔設置為10s,以保證數據可以傳輸。在傳輸範圍內接收。

4.2. 預測性能

數據上傳到服務器的數據庫後,可以通過訓練好的預測模型進行預測。參考 表 4,在這項工作中應用了兩個模型:(1)LSTM 模型和(2)MLP 模型,考慮到溫度、濕度和壓力值的預測。提議的模型在台灣環保局和 CWB 建立的大型數據庫上進行評估,其中包括台中天文台過去六年(2013 年 10 月 1 日至 2019 年 6 月 10 日)的約 50,000 小時測量值。請注意,兩個模型的預測值通過 RMSE、MAE 和百分比誤差與 2020 年 3 月 21 日 CWB 的實際測量值進行了比較。

4.2.1。LSTM 模型

參考 LSTM 模型的表 4圖 10是四個輸入組關於溫度、濕度和壓力的預測圖。 表 7顯示了通過 RMSE 和 MAE 值對不同輸入數據格式的預測結果。觀察第一個輸入組(G1)的性能更符合實際值。 表 8展示了具有不同單元數的 LSTM 模型之間的差異,計算了測試數據集的損失值和準確度,其中損失以均方誤差計算,最終模型使用的單元數為 50。





4.2.2. MLP模型

給定MLP 模型 表 4中 的輸入格式 ,圖 11是四個輸入組的預測圖,從中可以看出,第一輸入組(G1)的溫度和氣壓性能趨勢更符合實際價值觀。 表 9顯示了通過 RMSE 和 MAE 值的預測結果。對於濕度的預測,第二個輸入組(G2)的預測性能具有最小的RMSE、MAE和百分比誤差值(例如,RMSE(G1)=6.7972;RMSE(G2)=0.4853;RMSE(G3)= 5.3816;RMSE (G4) = 4.9940)。然而,由於缺乏正確的趨勢預測, 如圖 11所示並考慮溫度、濕度和壓力的整體預測性能,選擇第一個輸入組(G1)與使用 LSTM 模型的性能進行比較。




輸入格式 G1, 圖 12顯示了 LSTM 和 MLP 模型在溫度、濕度和壓力方面的預測結果對比,總結在 表 10中. 觀察到對於溫度預測,兩個模型的性能接近。從上午 8 點到下午 6 點,MLP 性能略好於 LSTM 性能。但是,LSTM 在其他時間段的性能更好。對於濕度和壓力參數,LSTM的預測性能優於MLP,可以實現更好的趨勢預測。雖然 LSTM 比 MLP 模型顯示出輕微的優勢,但上述結果可能是由於模型在訓練時的深度或每層使用的單元數和參數的差異。



4.3. 溫度預測比較

所提出的預測系統與 Parashar [ 14 ] 和 Varghese 等人的系統架構進行了比較。[ 16 ]。在這項工作中,基本硬件架構由 Raspberry Pi 和傳感器組成。數據傳輸和儲存是透過無線通信技術和數據庫進行的。帕拉沙爾 [ 14] 使用多元線性回歸 (MLR) 來訓練模型,這是一種使用多個解釋變量來預測響應變量結果的統計技術。然後分別選擇最高、最低和平均溫度的相對特徵值進行訓練。最後,根據過去三天的天氣數據,預測第二天的最高、最低和平均氣溫。本文提出的系統使用 LSTM 和 MLP 模型進行訓練,並預測未來 24 小時內的溫度、濕度和壓力值。 表 11顯示了 Parashar 系統之間的比較 [ 14]和提出的系統,包括訓練模型、特徵選擇、預測方法和資訊顯示。左側是 Parashar [ 14 ] 的系統,而右側是提議的系統。



所提出的系統主要預測溫度、濕度。和接下來 24 小時的壓力。相比之下,Parashar [ 14 ] 中的系統僅預測當天溫度的最大值、最小值和平均值。在 Varghese 等人。[ 16 ],使用 Raspberry Pi 和天氣感測器,使用線性回歸 (LR) 機器學習模型收集、訓練和預測數據,以透過平均絕對誤差和中值絕對誤差進行評估。所提出的預測系統基於每小時天氣數據進行訓練和預測,並使用百分比誤差、MAE 和 RMSE 作為評估標準。除了這三個評估標準外,還計算了解釋的溫度方差,以便與 Parashar [ 14 ]。比較主要針對平均溫度。



表 12描述了第二天平均溫度的溫度預測比較。在 MAE 性能方面,Varghese 等人的 LR 模型。[ 16 ] 具有 MAE 值,MAE (LR) = 2.5。Parashar [ 14 ] 中使用 MLR 模型的系統的預測性能 ] (MAE (MLP) = 1.10) 和具有 LSTM 模型的建議系統 (MAE (LSTM) = 1.056) 接近。並且所提出的具有 MLP 模型的系統具有最低的 MAE 值(MAE (MLP) = 0.7731),這表明所提出的模型擅長預測。在解釋方差中,所提出模型的性能也優於文獻。此外,所提出的系統可以提供過去和當前的天氣信息以及未來 24 小時的天氣預報值。



為了進一步評估預測能力,將建議系統的預測結果與 CWB 實際值、CWB 預測值和 AccuWeather 系統的預測值進行比較 [ 25 ],其中 AccuWeather 系統是美國的一家媒體公司,在全球範圍內提供商業天氣預報服務。 表 13是 2020 年 3 月 21 日台中最高氣溫和最低氣溫的實際值與預測結果對比。請參閱 CWB 預測報告 [ 20],台中2020年3月21日CWB預測值的最高和最低溫度分別在28-31°C範圍和18-21°C範圍內。對於預測最高溫度,AccuWeather 系統、提出的 LSTM 模型和提出的 MLP 模型分別具有 1.75%、5.26% 和 3.51% 的預測誤差。對於最低溫度的預測,AccuWeather 系統、提出的 LSTM 模型和提出的 MLP 模型分別具有 11.11%、2.53% 和 6.06% 的預測誤差,這表明提出的系統與現有系統具有競爭力。

5. 結論

本文提出了一種基於公車資訊管理的實時天氣監測與預報系統,結合資訊處理和機器學習,完成公車、車站、感測器之間的資訊通信和分析。所提出的系統包含四個核心組件:(1)資訊管理,(2)交互式公車站,(3)機器學習預測模型,以及(4)天氣資訊平台。該網站透過動態圖表顯示天氣資訊。除了當前的溫度、濕度、氣壓、降雨量、紫外線和 PM 2.5,系統還提供未來 24 小時的溫度、濕度和氣壓預測。

儘管所提出的系統實現了有效的天氣監測和資訊管理,但由於天氣的顯著變化可能會出現偏差,這是需要克服的主要挑戰。在未來的工作中,除了優化系統運行外,我們還計劃細化預測系統,考慮基於公車路線的節點部署,學習模型,包括更多的物理參數,探索預測和測量誤差對預測模型,重新分析數據集(例如,執行數據修訂),應用多個數據源 [ 26 ] 和資訊處理技術,這可以實現更好的預測準確性。



0 comments: