--------點擊屏幕右側或者屏幕底部“+訂閱”,關注我,隨時分享機器智能最新行業動態及技術乾貨--------
北京華夏電通科技有限公司成立於 2001 年,是一家多年深耕於司法領域的信息化建設工作的公司。從檢察院、法院的一級專網到如今正在建設中的“智慧法院”和“智慧檢察院”等項目中都有華夏電通的身影。可以說華夏電通參與了中國國家司法信息建設的全過程,因此也對於行業也有一些更加深刻的理解和實踐。
華夏電通從 2017 年開始和阿里接觸,在 2018 年雙方達成戰略合作協議。在這個過程中,阿里幫助華夏電通開拓了很強的技術思維。與此同時,華夏電通也充分地將人工智能技術應用到了自己的產品中去,比如結合庭審的特殊場景對於語音識別技術進行了場景化定製,對於整體產品的品質提升也起到了非常大的幫助。
本文主要分享的是人工智能檢測技術在司法監督管理上的應用。文章將主要分為以下的三個部分:
- 業務分析
- 應用實踐
- 困惑與展望
一、業務分析
首先,提出一個問題:如何定義司法監督。廣義上的司法監督包含的範圍很廣,包含了司法部門對於政府行為、個人行為的合法性監督,同時也包含了司法部門之間的相互監督。而在本文中主要涉及的是司法機構的行為和活動的狹義司法監督。
司法活動監督
司法活動監督是監督主體依照國家憲法和法律的規定,對於司法機關以及其工作人員的司法活動的合法性所進行的監督。其中主要涉及的主體包括以下四種:
- 人大監督:立法單位對於執法單位的監督,公檢法全過程監督。
- 檢查監督:檢察院對法院、司法執行部門的監督,案件審理公正性、刑罰執行合法性監督。
- 上下級監督:上級司法機關對下級司法機關執法過程的監督。
- 人民監督:司法內部監督的一種補充監督。
監督事務
對於具體執行監督過程而言,從技術的角度來看,包括了行為監督、形象監督、過程監督以及結果監督。
- 行為監督 指的是執法過程是否合法,是否存在暴力執法,犯人在看守過程中是否遭受了暴力對待,公安機關在逮捕犯罪分子的時候是否出現了超出允許的行為,法官日常和當事人接觸以及開庭過程中的行為是否合規等,這些信息更多的是從圖像中進行提取的。
- 形象監督 比如法官開庭時是否穿著法袍,公安出警時是否穿著警服等。
- 過程監督 包括每一項司法過程是否被完整記錄,是否按照法律要求執行相應的過程。
- 結果監督 即判決的結果是否合理、合法。而從時間點上進行劃分,可以分為事中和事後的監督。
傳統工作方法
傳統監督的工作方法就是看視頻、查文件、查系統、找人談。所謂看視頻就是坐下來觀看錄製視頻或者直播視頻;查文件就是翻閱現有的文件記錄;查系統就是查現在司法部門裡面各類能夠記錄執法過程的應用系統,通過查找統計報表在進行手工彙總;最後就是找人去談。大家可以想象一下,全中國如此之多的案件量,要想要實現對於所有案件的監督,在人工模式下是無法實現的,因此往往是人工抽樣的方式實現的,而抽樣率可能不到 1%,比如視頻抽檢率僅在萬分之幾左右。這是因為隨著音視頻技術的不斷髮展,人工所能覆蓋的面越來越小,因此對於監督工作的方法改變需求非常迫切。基於此,華夏電通也在不斷改善自己的產品,根據不同的應用場景來拓展應用實踐。
二、應用實踐
在這一部分為大家介紹了一些華夏電通已經落地實現的應用實踐場景。
- 立案窗口巡查:這主要是針對法院的應用,在立案窗口中會對於收案過程行為的規範進行監督,也就是對於立案窗口的法官和當事人的交流過程的用語、著裝等是否規範以及態度是否端正等進行監督。這些數據需要從訴訟大廳的監控中進行抽取。此外,還有需要對於案卷的系統數據以及立案時所用卷宗是否完整等進行監督。
- 庭審過程巡查:對於庭審過程中法官的行為、著裝是否得當,是否存在違規、違法行為,筆錄的記錄是否完整,以及庭審是否符合完整的法律程序約定要求等進行監督。
- 裁判文書巡查:對於判決內容進行檢查,對於文書完整性、用於規範性進行內部檢查,此外還有未來將會持續推進的檢察院對於裁判文書的合法性檢查。
- 關鍵場所巡查:關鍵場所巡查目前主要的應用場景在法院,比如重大庭審時法院門口以及日常時間法院門口是否存在可疑行為人等,這屬於將通用技術應用到專業場景中的應用。
- 刑罰執行巡查:主要指的是檢察院對於監獄、看守所內部的日常監控圖形進行巡查。
- 刑訊過程巡查:主要指的是對於公安的刑訊過程進行監督檢查。
應用技術
在以上場景的自動化過程落地實施中,用到了很多的技術,包括了視頻分析、音頻分析、文本分析、語音識別、文本識別以及自然語言分析等。
- 視頻分析包括對於違規行為、違規形象以及視頻質量的分析。
- 音頻分析包括對於聲音質量以及特殊聲音的分析。
- 文本分析包括關鍵分析以及衝突檢測等。
- 語音識別包括用語分析以及特殊聲音分析等,當然這裡面更好的是使用聲紋分析,華夏電通在這方面正在與阿里進行溝通,希望能夠在未來展開合作。
- 文本識別則包括備查文件電子化和票據識別,比如通過 OCR 技術來提取關鍵信息。
- 自然語言分析則包括了文書邏輯和語法的分析等。
對於這些技術而言,也正是剛起步的階段。因此,華夏電通和阿里巴巴正在和法院和檢察院等單位共同尋找更好的模式,希望能夠使得人工智能技術和司法監督檢查工作實現更好的結合。
三、困惑及展望
應用困惑
華夏電通在和阿里合作做人工智能相關問題的過程中也遇到了一些問題和困惑,主要包括三個,即準確度、效率以及成長性。
- 對於準確度而言,大家很好理解,語音識別的準確度在庭審裡面以及監督檢查中很重要,不能對於沒有出現問題的地方識別出問題,這部分需要和阿里巴巴合作不斷進行提升。
- 對於效率而言,如今視頻數據量非常之大,如果將所有的庭審視頻或者監控記錄全部播放一遍,所需要的時間以及運算量都會非常大,因此很難完成。所以,對於倍速檢測、抽幀檢測等技術如何更加深入地使用,來提升視頻的檢測效率,保證在對原始數據進行檢查的基礎之上,進一步提升檢查效率是一件華夏電通一直在努力的事情。
- 對於成長性而言,無論是對於法院還是檢察院來說,監督的場景一直在擴展,而機器學習的過程更多還是依賴於後臺的技術大牛們。往往需要將數據樣本採集完成然後交給這些技術大牛們來完成。
而在未來,華夏電通希望阿里能夠提供更多的行業性的學習工具,也希望能夠儘快地獲取到這些行業性的學習工具。這是因為司法行業的特殊性,無法將所有的數據搬移到阿里雲上去,因此只能依靠自己通過學習工具來訓練模型,而產生學習的結果可以反饋給阿里,幫助引擎的成長。這也是華夏電通和阿里巴巴合作總結出來的比較成熟的技術路線,同時,這種做法也是符合客戶的預期的。