2023.10.28【AI與大數據的政府應用課題】張文熙主任

「孫運璿講堂」在2023年10月28日邀請財政部財政資訊中心張文熙主任主談「AI與大數據的政府應用課題」。張主任特別提出政府應用AI及大數據的困難有以下幾點。一是議題選擇困難,包括人工智慧議題限制、期待和需要落差。二是理論理解的困難,包括業務背景融合及跨域知識整合,另外還有機關缺乏AI 人才與訓練環境。三是資料取得的困難,這包括資料來源格式及定義不同,例如同樣的男女性別,在內政部、財政部等單位的編號就有差別。或者如地址欄位也有通訊地址、永久地址、自用住宅與長期住所等差異。這些差異也造成資料整理工序及解讀繁瑣。四是資訊安全顧慮,包括個人資料保護形成使用限制,以及資安防護措施使複雜度提高等。

張主任也特別提出AI成功應用的關鍵因素分析。首先是前置作用,著重在觀念建立。包括了解AI能做什麼,不能做什麼?現行業務問題究竟是需要自動化,還是AI?預期AI 導入成效為何?張主任特別說明,85%時間在資料整理,分析只有15%。

其次是訂立推動計畫,包括協作分工、分析平台、與應用模型。協作分工除收集資料與智慧客服知識庫外,還需要對話式應用,並籌辦資料科學工作坊等。分析平台則有數據分析及開發環境、協同合作機制建構、申請管理、與假名化資料管理。應用模型則有超自動化應用、結合現有系統、與獨立運用作業等。

第三是AI應用效益分析與成本規劃。張主任強調,熟悉數據分析流程是AI能否順利導入關鍵。這包括資料篩選、資料整備、特徵整理、探索性資料分析、機器學習建模、結果評估及解讀、整合應用等。尤其在數據特徵解讀相當重要。以智能稅務應用系統架構來看,從條件式選案、風險型選案、到智能型選案,就必須有清楚的條件設定、風險評估與權重,這就需要人腦智慧的投入,仰賴專業知識經驗累積。例如由虛報進項、短漏報銷售額、涉嫌開立不實統一發票、進出口異常或冒退、跨區局選案等,便是將選案人員經驗系統化的重要實務,目前財政資訊中心已規劃44個選案模組以供應用。

總結來說,財政資訊中心已完成多項成果,包括交易關係網絡分析、風險事件及條件預測、發票異常案件偵測、行為資訊及流程挖掘、虛列成本及收益預測、智慧客服知識庫等。張主任特別說明,AI(Artificial Intelligence)人工智慧較之過去BI(Business Intelligence)商業智慧的最大差別,就在能將過去的BI「儀表板」圖示轉化為具體行動指引。他並強調:「有AI無資料,就像缺了腳;但有資料無AI,則像瞎了眼」,AI與資料品質二者缺一不可。