【中國安防展覽網 企業關注】本文就當前環境下, 網路安全與執法專業引入大資料相關課程體系的必要性進行了論述。 結合該專業自身特性, 對擬引入的大資料相關專業課程提出了選擇建議, 同時對擬引入的課程教學內容和其在網路安全與執法專業的業務應用方向進行了闡述。
引言
隨著互聯網的高速發展, 資訊技術這把雙刃劍為我國公安部門提出了新的問題和發展方向。 一方面, 各種網路犯罪、網路突發輿情、網路洩密等危害國家安全和社會穩定的情況對網路安全與執法提出了更高要求;另一方面,
該專業的培養目標, 主要是為公安機關培養網路安全與執法人才, 要求其既懂技術, 又會管理和執法。 在其專業課程設置上, 具有顯著的公安特色, 如法律、現場勘察, 電腦取證等, 同時, 在技術層面上, 又緊貼電腦及網路相關專業。 要求其學員具備電腦科學與技術、資訊安全學科的基本理論和知識, 熟悉網路安全與執法工作的相關法律法規知識, 具備網上發現和處置、網上偵查和網上違法違規行為防範和控制的能力, 能勝任網路安全與執法方面的實際業務工作,
當前, 各院校在該專業的技術領域電腦技術方向上, 主要偏重於電腦基礎、網路技術、網路安全技術等, 而大資料技術的發展, 為其相關專業課程的引入提出了新的需求。
大資料相關專業課程的設置必要性
傳統的偵查模式基本上是從案到人的偵查模式, 而面對現代高智慧犯罪、恐怖活動犯罪以及突發性群體事件, 傳統的偵查模式不能在事發前就對其進行預防, 及時地發現犯罪跡象, 對其進行控制和打擊, 以避免事態惡化。 而現代偵查模式能及早地發現犯罪跡象,
大資料(big data), 指無法在一定時間範圍內用常規軟體工具進行捕捉、管理和處理的資料集合, 是需要新處理模式才能具有更強的決策力、洞察發現力和流程優化能力的海量、高增長率和多樣化的資訊資產。
隨著大資料技術的發展, 部分國家開始建立大資料驅動的犯罪偵查和控制體系, 該體系利用大資料分析歷史案件、發現犯罪趨勢以及犯罪模式;通過挖掘城市和社交網路資料, 進行犯罪預測;利用大資料優化警力資源配置等。
綜上所述, 在網路安全與執法專業, 開設大資料相關課程, 是有其必要性和緊迫性的。
大資料方向專業課程體系建設
雖然在網路安全與執法專業的教學中, 引入大資料相關專業課程是有必要性和緊迫性的, 但是要全面引入大資料的專業課程, 明顯是不現實的, 同時, 也並無必要。 在此, 筆者根據網路安全與執法專業的專業特性和需求, 結合大資料相關技術的特點和應用方向, 綜合分析研究, 推薦選擇以下幾門課程作為網路安全與執法專業大資料方向的專業課程, 形成網路安全與執法專業大資料方向的專業課程體系。 資料採擷基礎(專業基礎課);多元統計分析(專業課);流式資料處理(專業課);大資料方向專業課程教學內容。
3.1 資料採擷基礎
資料採擷是一門新興的交叉性學科,是在資訊技術領域迅速興起的電腦技術。資料採擷技術面向應用,在很多重要的領域,資料採擷都發揮著積極的作用,是大資料應用的主要手段之一。在犯罪偵查、線索搜集、網路監管、輿情監控等各個方向上,都有重要的應用。
資料採擷基礎全面介紹資料採擷的原理、方法和演算法。主要內容包括資料採擷的基本概念、資料採擷演算法的資料類型、輸入和輸出、決策樹、資料採擷的預處理和後處理、關聯規則挖掘、分類和回歸演算法、支援向量機、聚類分析及多維資料視覺化。
該課程作為專業基礎課,通過該課程的學習,使學員瞭解資料採擷技術的整體概貌,瞭解資料採擷技術的主要應用及當前的研究熱點問題,瞭解資料採擷技術的發展方向,掌握最基本的概念、演算法原理和技術方法。
3.2 多元統計分析
多元統計分析是從經典統計學中發展起來的一個分支,是一種綜合分析方法,它能夠在多個物件和多個指標互相關聯的情況下分析它們的統計規律,是數理統計學中的一個重要的分支學科。主要內容包括多元正態分佈及其抽樣分佈、多元正態總體的均值向量和協方差陣的假設檢驗、多元方差分析、直線回歸與相關、多元線性回歸與相關(Ⅰ)和(Ⅱ)、主成分分析與因數分析、判別分析與聚類分析、Shannon信息量及其應用。簡稱多元分析。
多元統計可以處理以下幾類實際問題。
多重回歸分析,簡稱回歸分析。其特點是同時處理多個因變數。回歸係數和常數的計算公式與通常的情況相仿,只是由於因變數不止一個,原來的每個回歸係數在此都成為一個向量。該分析可以通過多個因變數的處理,統計分析某一因變數的變化趨勢。
判別分析,由 k個不同總體的樣本來構造判別函數,利用它來決定新的未知類別的樣品屬於哪一類,這是判別分析所處理的問題。它在網路安全與執法、偵察各方面都有廣泛的應用。
聚類分析,又稱數值分類。聚類分析和判別分析的區別在於,判別分析是已知有多少類和樣本來自哪一類,需要判別新抽取的樣本是來自哪一類;而聚類分析則既不知有幾類,也不知樣本中每一個來自哪一類。
主成分分析,又稱主分量分析,是將多個變數通過線性變換以選出較少個數重要變數的一種方法。在根據樣本進行主成分分析時又可分為R型分析與Q型分析。前者是用樣本協差陣(或相關陣)的特徵向量作為線性函數的係數來求主成分;後者是由樣品之間的內積組成的內積陣來進行類似的處理,其目的是尋找出有代表性的“典型”樣品,這種方法在地質結構的分析中常使用。
其他還有對應分析、因數分析、對應相關分析等。
該課程作為專業課,通過該課程的學習,掌握其各種分析方法,在網路輿情監控、犯罪偵查、線索搜集、犯罪預防、群體事件輿情事件防控等方面,都有較為廣泛的應用。
3.3 流式資料處理
流式資料處理,指標對流式資料的一種分散式、高可用、低延遲、具有自身容錯性的即時計算技術,它是根據一組規則來動作的工具,通過提取和分析來自各種分散式系統的資訊,來解決監控和管理的各種問題。
該課程作為專業課設置,其主要教學內容包括即時資料採集,即時資料處理,即時查詢服務,當前主流流式資料處理產品簡要教學等內容。
流式資料處理技術主要針對資料時效性要求高,原始資料量大,資料量變化迅速,業務生命週期短的大資料應用。其應用特性和網路安全與執法專業所面對的資料特性具有高度契合性,可廣泛應用於犯罪偵查,即時線索採集,即時追蹤,網路輿情監管,突發事件防控,治安管理,警力調度,網路資訊採集監管等各個方面。
結語
對於網路安全與執法專業來說,大資料相關專業體系的引入,對於偵查體系的提升,業務能力的加強,監管手段的豐富,覆蓋面積的加大等各個方面來說,都有其重要的現實意義和緊迫性。同時,對於學員的個人能力提升和知識廣度的擴大,增大學員的就業面,也有其實際作用。但是,當前現狀下,大資料相關專業課程也存在人才儲備不足,師資力量薄弱的問題。相關院校可在條件成熟時,結合自身條件,適時引入大資料相關專業課程體系,建設有特色的網路安全與執法專業。
資料採擷基礎(專業基礎課);多元統計分析(專業課);流式資料處理(專業課);大資料方向專業課程教學內容。3.1 資料採擷基礎
資料採擷是一門新興的交叉性學科,是在資訊技術領域迅速興起的電腦技術。資料採擷技術面向應用,在很多重要的領域,資料採擷都發揮著積極的作用,是大資料應用的主要手段之一。在犯罪偵查、線索搜集、網路監管、輿情監控等各個方向上,都有重要的應用。
資料採擷基礎全面介紹資料採擷的原理、方法和演算法。主要內容包括資料採擷的基本概念、資料採擷演算法的資料類型、輸入和輸出、決策樹、資料採擷的預處理和後處理、關聯規則挖掘、分類和回歸演算法、支援向量機、聚類分析及多維資料視覺化。
該課程作為專業基礎課,通過該課程的學習,使學員瞭解資料採擷技術的整體概貌,瞭解資料採擷技術的主要應用及當前的研究熱點問題,瞭解資料採擷技術的發展方向,掌握最基本的概念、演算法原理和技術方法。
3.2 多元統計分析
多元統計分析是從經典統計學中發展起來的一個分支,是一種綜合分析方法,它能夠在多個物件和多個指標互相關聯的情況下分析它們的統計規律,是數理統計學中的一個重要的分支學科。主要內容包括多元正態分佈及其抽樣分佈、多元正態總體的均值向量和協方差陣的假設檢驗、多元方差分析、直線回歸與相關、多元線性回歸與相關(Ⅰ)和(Ⅱ)、主成分分析與因數分析、判別分析與聚類分析、Shannon信息量及其應用。簡稱多元分析。
多元統計可以處理以下幾類實際問題。
多重回歸分析,簡稱回歸分析。其特點是同時處理多個因變數。回歸係數和常數的計算公式與通常的情況相仿,只是由於因變數不止一個,原來的每個回歸係數在此都成為一個向量。該分析可以通過多個因變數的處理,統計分析某一因變數的變化趨勢。
判別分析,由 k個不同總體的樣本來構造判別函數,利用它來決定新的未知類別的樣品屬於哪一類,這是判別分析所處理的問題。它在網路安全與執法、偵察各方面都有廣泛的應用。
聚類分析,又稱數值分類。聚類分析和判別分析的區別在於,判別分析是已知有多少類和樣本來自哪一類,需要判別新抽取的樣本是來自哪一類;而聚類分析則既不知有幾類,也不知樣本中每一個來自哪一類。
主成分分析,又稱主分量分析,是將多個變數通過線性變換以選出較少個數重要變數的一種方法。在根據樣本進行主成分分析時又可分為R型分析與Q型分析。前者是用樣本協差陣(或相關陣)的特徵向量作為線性函數的係數來求主成分;後者是由樣品之間的內積組成的內積陣來進行類似的處理,其目的是尋找出有代表性的“典型”樣品,這種方法在地質結構的分析中常使用。
其他還有對應分析、因數分析、對應相關分析等。
該課程作為專業課,通過該課程的學習,掌握其各種分析方法,在網路輿情監控、犯罪偵查、線索搜集、犯罪預防、群體事件輿情事件防控等方面,都有較為廣泛的應用。
3.3 流式資料處理
流式資料處理,指標對流式資料的一種分散式、高可用、低延遲、具有自身容錯性的即時計算技術,它是根據一組規則來動作的工具,通過提取和分析來自各種分散式系統的資訊,來解決監控和管理的各種問題。
該課程作為專業課設置,其主要教學內容包括即時資料採集,即時資料處理,即時查詢服務,當前主流流式資料處理產品簡要教學等內容。
流式資料處理技術主要針對資料時效性要求高,原始資料量大,資料量變化迅速,業務生命週期短的大資料應用。其應用特性和網路安全與執法專業所面對的資料特性具有高度契合性,可廣泛應用於犯罪偵查,即時線索採集,即時追蹤,網路輿情監管,突發事件防控,治安管理,警力調度,網路資訊採集監管等各個方面。
結語
對於網路安全與執法專業來說,大資料相關專業體系的引入,對於偵查體系的提升,業務能力的加強,監管手段的豐富,覆蓋面積的加大等各個方面來說,都有其重要的現實意義和緊迫性。同時,對於學員的個人能力提升和知識廣度的擴大,增大學員的就業面,也有其實際作用。但是,當前現狀下,大資料相關專業課程也存在人才儲備不足,師資力量薄弱的問題。相關院校可在條件成熟時,結合自身條件,適時引入大資料相關專業課程體系,建設有特色的網路安全與執法專業。