近年來,在使用掃描圖像讀取數(shù)據(jù)的自動化 *** 方面取得了重大進展。這種 *** 有助于自動索引文本,以便它們可以搜索和機器可讀。然而,當涉及到地圖數(shù)據(jù)時,到目前為止只有有限的工作。
新 *** 不僅可以檢測位置名稱并使其可搜索,而且現(xiàn)在可以恢復(fù)現(xiàn)代地圖中大部分缺失的數(shù)據(jù)。
將地圖標簽與地理數(shù)據(jù)聯(lián)系起來
makKurator 項目是一個有助于使舊地圖提供可索引和可讀的文本和可視數(shù)據(jù)的新項目。該項目一直在使用將地圖標簽與給定空間相關(guān)聯(lián)的深度學(xué)習(xí)度量 *** 。
讀取地圖的自動化 *** 面臨的一項挑戰(zhàn)是確定位置標簽,包括具有多個單詞名稱的位置標簽,并將給定文本與特定位置相關(guān)聯(lián)。通過確定給定地點與其標簽之間的適當距離度量,包括術(shù)語之間的距離,以便清楚地表明這些術(shù)語是相關(guān)的,可以將文本分類到所指示的適當位置。

添加微信好友, 獲取更多信息
復(fù)制微信號

在這種新 *** 中,視覺預(yù)測器分割給定區(qū)域并在文本項和 位置的邊界區(qū)域之間建立聯(lián)系。關(guān)鍵輸出包括一個概率圖,它使用文本標簽對給定的地圖像素進行分類,以便可以在一定程度上建立聯(lián)系。
新 *** 的一個主要好處是它使地圖特征和數(shù)據(jù),包括那些由文本指示的,可以在地圖內(nèi)和地圖之間進行搜索,從而可以在數(shù)據(jù)之間建立聯(lián)系。例如,如果想在舊地圖上搜索 1000 英尺以上的高度,那么僅使用圖像作為輸入數(shù)據(jù)就可以實現(xiàn),其中高度將從視覺數(shù)據(jù)和標簽中自動提取。
這項工作最近使研究人員與 Rumsey Map Collection 之間的 合作成為可能,這將使地理參考地圖能夠通過文本進行搜索。這使其成為可以使用基于文本的搜索進行搜索的更大地圖存儲庫,可以有效地使舊地圖在搜索和識別感興趣的地方時 與 OpenStreetMap 一樣可用。
使用深度學(xué)習(xí) *** 從地圖中提取地理元數(shù)據(jù)
最近的 *** 還支持深度學(xué)習(xí) *** ,例如使用具有數(shù)據(jù)增強功能的卷積神經(jīng) *** (CNN),只需使用現(xiàn)有的地理形狀位置就可以更好地分類和了解地理。
例如,通過地圖提供國家或大陸的形狀,可以根據(jù)地理名稱對這些地理特征進行分類。這有助于限制訓(xùn)練數(shù)據(jù)需求的數(shù)量,使研究人員更容易創(chuàng)建可以在地圖上創(chuàng)建自動位置檢測的 *** ,包括僅掃描過的舊地圖。
從歷史地圖中提取地理數(shù)據(jù)
近年來,學(xué)者們在利用歷史地圖進行各種特征識別和提取方面也取得了進展。例如,了解舊道路的位置對于重建一個地區(qū)的地點和歷史數(shù)據(jù)可能很重要。
使用舊地圖,研究人員已經(jīng)能夠使用完全卷積 *** 從舊地圖中提取舊道路和小徑,這些 *** 使用帶注釋的道路數(shù)據(jù)進行預(yù)訓(xùn)練,用于訓(xùn)練數(shù)據(jù)。然后,這些模型可以從不同時期的地圖中識別出不同類型的道路。

其他工作還實現(xiàn)了舊地圖上給定符號的自動識別和分類,以便它們可以數(shù)字化并用于更現(xiàn)代的地圖繪制。與道路識別和地圖增強工作類似,使用 CNN 變體的深度學(xué)習(xí)使符號能夠更容易地被識別,從而可以對它們進行分類以供使用。
深度學(xué)習(xí)自動從歷史地圖中提取地理數(shù)據(jù)
我們越來越多地看到學(xué)者們在尋找新的 *** 來自動對關(guān)鍵地圖特征進行分類,同時還利用地圖中的文本數(shù)據(jù),以便文本和其他信息可以被索引和搜索。這現(xiàn)在使舊地圖成為更強大的資源,因為它們變得與使用類似 *** 的現(xiàn)代數(shù)字地圖一樣有效。
通過利用深度學(xué)習(xí),研究人員可以從歷史地圖中提取大量新數(shù)據(jù),包括文本和視覺數(shù)據(jù),將我們的現(xiàn)代世界與發(fā)生變化或現(xiàn)代地圖中缺少信息的景觀和地區(qū)聯(lián)系起來。
來源:開源地理空間基金會中文分會
來源鏈接:https://www.osgeo.cn/post/1c240
本站聲明:網(wǎng)站內(nèi)容來源于 *** ,如有侵權(quán),請聯(lián)系我們,我們將及時處理。