財稅行業 | 智稅中臺 – 小科科的春天

稅務行業在構建大數據平臺以後，有了海量的數據挖掘需求，但應用方式還集中於業務理解，人工配置規則進行掃描與風險識別的傳統方式上。而基於統計和深度數據挖掘的算法工作，又存在知識門檻高、建模難度大、流程耗時長等難點，稅務人員難以高效使用。

通過智稅中臺的建設，稅務行業客戶能夠搭建自主易用的稅務專用數據智能平臺，通過標籤體系，實現自助式數據建模與分析；通過機器學習等算法模型，可降低數據智能應用的難度，實現一體化的特徵管理、數據探查、分析建模，建立對接業務生產的風險管理引擎，從而達到協助業務流程提升數據智能程度的目的。智稅中臺基於阿里雲大數據平臺提供了從數據加工到智能建模的一整套適配政務行業的機器學習工具鏈。

解決方案

（一）特徵中心

將數據特徵以標籤形式管理，全圖形化操作，向下屏蔽計算與存儲資源，讓用戶專注業務邏輯，且通過自動化數據脫敏、行列權限控制，實現最靈活和安全的數據取用模式。

（二）指標立方

數據探查、數據探索及指標立方集成了完整的數據指標評測與研判工具集合，可以一鍵式形成對數據指標的效果報告。

（三）模型中心

提供從無標籤數據到有標籤數據的全場景數據建模支撐，在自動化智能建模的技術幫助下，用戶無需專業知識即可實現數據建模。

（四）風險管理引擎

提供了對模型結果的管理與對接上線功能，直接提供API形式的在線模型預測，並實現高併發、高可用的技術指標。

應用價值

（一）圖形化特徵管理

針對業務專家的技術能力及使用習慣，提供圖形化數據特徵管理，並集成數據脫敏、行/列權限控制等功能，在全程可控的前提下，實現數據“可用不可見”一一即在多源數據融合匯聚的平臺上，只允許程序和算法訪問到融合後的數據，而不允許業務人員訪問、下載數據，從而在多用戶共存的平臺上有效地防止數據洩露事件的發生。

（二）一站式數據探查

針對數據智能建模的需求，提供圖形化數據探查功能，集成各類統計功能，形成全面的數據指標評估，並支持一鍵生成指標評估報告。

（三）智能化數據建模

針對稅務行業的業務特點，提供一系列從無監督，到半監督，到有監督的數據建模工具，並支持優選的數據清洗策略、自動化參數推薦、可視化算法效果等功能，讓業務人員無需深度算法知識，也能實現算法建模。

最佳實踐

（一）虛開發票企業分類

在稅務總局查找暴力虛開增值稅發票的場景中，需要對有風險的納稅人劃分為以下四個類別中的某一類：1. 虛開企業；2. 變票企業；3. 洗票企業；4. 用票企業。傳統做法是業務專家需要根據納稅人的指標數據對所有的風險納稅人進行標註處理，利用人工的方式實現所有風險企業的分類處理。在協同分類中，業務專家只需要從這四類企業中各挑選少量的納稅人，協同分類便會自動為剩餘的納稅人實現分類處理。協同分類在少量樣本的基礎上便可實現比較理想的分類結果，有效地提高了業務專家的工作效率。

（二）納稅人分類輔助政策制定

在稅收優惠上，對所有的納稅人使用相同的稅收優惠政策是不科學的；對每一個納稅人使用不同的稅收優惠政策是非常不高效的。首先使用行業分群，對每個行業的企業提取多維特徵（與業務相關的特徵，如企業規模、註冊資金、營收收入、利潤率、納稅額等），然後將每個行業的企業分成K個群，每一個群使用同一套服務政策。這樣即做到高效與科學，又能在事後對每個群進行的政策進行分析來判斷是否合理與如何優化。

（三）納稅企業疑似“騙稅團伙”識別

在稅務的風險管理中，大量風險企業雖然自身的屬性特徵多種多樣，但在關係網絡中通常表現出特定的形態。風險企業很難改變與其相關聯的企業屬性。將風險企業相關的其他企業作為當前企業的特徵，可以更可靠地發現風險企業。

（四）稅務虛開發票風險評估

在稅務機關的發票虛開風險應對中，業務專家根據業務經驗加工與發票虛開相關的指標數據，然後業務專家通過挑選所掌握的納稅人集合，人工對這些納稅人的風險大小進行排序，並將排序後的納稅人風險大小作為專家建模的輸入。專家建模會計算每個指標的最佳權重、所有納稅人在發票虛開場景中的風險大小。用戶在專家建模的過程中可以將精力放在業務分析上，降低了業務專家使用大數據算法的學習成本。

加入釘釘群可享有以下權益↓

Leave a Comment Cancel Reply