閃洪每年奪走數千條生命。它們來得迅速,最嚴重影響城市,數十年來科學家幾乎無法預測,因為用於訓練預測模型的資料根本不存在。 週四,Google 表示他們找到了解決方案——透過閱讀新聞。 該公司推出了 Groundsource 系統,利用 Gemini AI 瀏覽自2000年以來的數百萬篇新聞文章,提取洪水事件的相關資訊,並將每個事件與地點和日期連結。結果是一個包含超過150個國家、260萬筆歷史閃洪資料的資料集,現已開放供任何人下載與使用。
該資料集隨後被用來訓練一個新的人工智慧模型,能預測未來24小時內閃洪是否可能襲擊城市區域。這些預測現已在 Google 的 Flood Hub 上實時運行,該平台已用來警告全球約20億人有關河川洪水的威脅。 Groundsource 解決的問題其實非常基本。河流有物理測站——水中安裝的感測器,數十年來一直在記錄水位。這就是預測河流何時會氾濫的方法。而城市街道沒有類似的裝置。當強降雨沖刷路面並超過排水系統時,洪水來得太快、太局部,傳統儀器難以追蹤。 沒有歷史資料,就無法訓練出能辨識這種模式的 AI 模型。Google 的解決方案是將新聞文章視為缺失的感測器。
“透過將公共資訊轉化為可行的數據,我們不僅在分析過去,更在為每個人打造一個更具韌性的未來,朝著我們的目標——不讓任何人對自然災害感到驚訝。” Google 表示。
資料來源:Google
在過濾掉廣告、導航菜單和重複內容,並將其他語言的文章翻譯成英文後,團隊將數百萬雜亂的文字描述轉化為乾淨的、具有地理標記的時間序列資料。 訓練該模型所用的資料採用 LSTM 神經網絡——一種專為處理時間序列的 AI 技術——結合每小時天氣預報與當地因素,如城市化密度、土壤吸收率和地形。模型會輸出一個簡單的信號:在未來24小時內,某個城市區域的洪水風險為中或高,前提是該區域的人口密度超過每平方公里100人。 該系統存在一些限制。它每次只能覆蓋約20平方公里的範圍,無法預測洪水的嚴重程度,也在新聞報導較少的地區表現不佳。 儘管如此,早期結果已經顯示出成效。在南部非洲的一個地區災害管理機構在測試階段收到了 Flood Hub 的警報,確認洪水事件,並派遣人道工作者進行應對。根據 Google 危機韌性主管 Juliet Rothenberg 的說法,“從 Flood Hub 的預測到實地行動的整個鏈條,正是 Flood Hub 建立的目的。”