公 務 員 通 訊 二 零 二 四 年 十 二 月 第 一 百 一 十 八 期
科技創新·明天更好:機電工程署在第四十九屆  日內瓦發明展上大放異彩

政府統計處

政府統計處(統計處)近年來積極探索人工智能(AI)和數據科學在官方統計工作中的應用,以推進數字化轉型,提升統計服務在大數據時代的運作效率和質素。

為促進數字化轉型,統計處正致力推動以下兩項重要發展:

提升效率 以AI模型協助編製貿易統計數字

統計處每日處理約七萬份進出口報關單,全年共約一千八百萬份,用以編製對外商品貿易統計數字。二零二三年,有關處理程序涉及核實近三百六十萬項貨物分類及其申報單價,並涵蓋八千項統計類別。

統計處須在短時間內準確驗證大量數據,以便按時完成編製每月貿易統計數字,所面對的挑戰甚大。多年來,審查貨物說明時均需要大量人力,因為這些說明通常採用自由文本格式,難以由傳統上以規則為基礎的電腦系統有效處理。

由二零一八年起,統計處不斷探索使用AI模型分析大量非結構化的文本數據,目標是利用AI提升數據驗證過程的質素和效率。

由部門內部開發的AI模型採用了深度學習算法,通過對數百萬條已標記的貨物描述進行訓練,以預測每份貿易申報的貨物編號,並驗證其單位價格。

自動貨物編碼和單位價格異常檢測方法十分創新,大大減少了人手檢查的需求,同時也提升了數據質素。在新冠疫情期間,此舉措更有助統計處應對當時的嚴峻挑戰。

球型機器人以協助視察及救援工作 (與香港警務處協作)
兩位統計師正在檢查用於編製貿易統計數字的AI程式代碼。

今年年初,新方法已在工作流程中全面實施,令所需人力減少了四成。有關資源獲重新分配,用以在統計處設立了兩個策略性的新科別:數據科學科及社會數據發展科。此外,部門亦在其他涉及大數據的統計範疇加強了人手安排。這使統計處能夠更好地為日新月異的大數據時代作好準備,並在各個領域提供更完備的統計分析服務。

運用行政數據 重塑香港人口普查

除了傳統的抽樣調查外,統計處也一直探索用於編製統計資料的新數據來源,以降低數據收集成本和減輕受訪者的負擔,同時確保編製統計數據的質素。

統計處計劃由2026年人口普查開始,更廣泛和有系統地運用各政府部門收集的行政數據,而應用範疇主要包括以下兩方面:

第一方面,是以行政數據替代人口普查中的部分問題(如公共房屋租金、福利金額等問題),從而減少數據收集的成本和受訪者的負擔。統計處採用自行研發以AI技術為基礎的記錄連接工具,在屋宇單位層面高效準確地把普查樣本數據與行政記錄進行配對。

第二方面,是以行政數據取代2031年人口普查中覆蓋約九成住戶的「短問卷」。目前,統計處已全面運用匿名化的出入境記錄,編製更精確的人口估計數字,無須再依賴「短問卷」,從而顯著縮小操作規模並降低成本。

新的方式會納入更多行政數據,並重新設計工作流程,預計可大幅降低成本。統計處估計2026年和2031年人口普查的總成本將減少四成,按現時價格計算,大約能節省六億八千萬港元。

除上述兩項發展外,統計處具前瞻性的大數據策略亦涵蓋前沿技術的探索與應用,例如以無人機輔助和網頁抓取技術進行智能數據收集、用於文件處理的電腦視覺技術等。全方位的能力建設計劃涵蓋數據科學培訓、跨部門數據科學項目合作,以及資訊科技基礎設施升級。透過此計劃,統計處把握數字化轉型機遇的能力已大為提升。

這些舉措充分展示了統計處致力應用AI技術的決心,確保我們在日趨數字化的世界保持智慧統計的領先地位。

兩位統計師正在檢查用於編製貿易統計數字的AI程式代碼。
推動2026年人口普查現代化:匯聚各方行政數據的生態圈。