歡迎訪問西安融智慧安智能科技有限公司官方網(wǎng)站!
第一章 總體概述
互聯(lián)網(wǎng)、物聯(lián)網(wǎng)、云計(jì)算等信息技術(shù)與通信技術(shù)的迅猛發(fā)展使我們步入了大數(shù)據(jù)時(shí)代,人類活動(dòng)產(chǎn)生的數(shù)據(jù)呈爆發(fā)式增長(zhǎng),由于海量數(shù)據(jù)背后存在巨大商業(yè)價(jià)值,數(shù)據(jù)泄漏、數(shù)據(jù)盜用、數(shù)據(jù)濫用事件時(shí)有發(fā)生,因此,如何保障數(shù)據(jù)安全,成為了國(guó)家、企業(yè)和個(gè)人面臨的嚴(yán)峻挑戰(zhàn)。
目前,大多數(shù)政府、企業(yè)、機(jī)構(gòu)都會(huì)將大量敏感數(shù)據(jù)存儲(chǔ)在自己的后臺(tái)數(shù)據(jù)庫中,在業(yè)務(wù)過程中將不可避免的產(chǎn)生數(shù)據(jù)訪問、復(fù)制和交換等行為。大數(shù)據(jù)時(shí)代背景下,數(shù)據(jù)作為新興的生產(chǎn)要素,毫無疑問,已逐漸成為企業(yè)甚至國(guó)家的基礎(chǔ)性和戰(zhàn)略性資源,但數(shù)據(jù)背后的價(jià)值越高,數(shù)據(jù)的安全性需求愈發(fā)凸顯。2021年初,國(guó)家網(wǎng)信辦、工信部、公安部等多部門對(duì)數(shù)據(jù)安全、網(wǎng)絡(luò)信息安全等涉及到國(guó)家安全的領(lǐng)域密集出臺(tái)相關(guān)監(jiān)管措施,從上至下編織起“數(shù)據(jù)安全”和“網(wǎng)絡(luò)安全”兩張大網(wǎng)。
2021年7月10日,《網(wǎng)絡(luò)安全審查辦法(修訂草案征求意見稿)》公開征求意見; 9月1日,《中華人民共和國(guó)數(shù)據(jù)安全法》開始實(shí)施;11月1日,《個(gè)人信息保護(hù)法》正式施行,多部聚焦于數(shù)據(jù)安全的法律法規(guī)的密集頒布,可見國(guó)家和企業(yè)對(duì)于數(shù)據(jù)安全建設(shè)的訴求已經(jīng)提升到一個(gè)全新層次。因此,在數(shù)據(jù)使用過程中,如何保證不同敏感類型、級(jí)別的數(shù)據(jù)能夠安全地被不同需求,不同權(quán)限、角色的用戶規(guī)范、合理的使用,減少敏感數(shù)據(jù)被非法使用或泄漏的風(fēng)險(xiǎn),已成為數(shù)據(jù)擁有者們最為關(guān)注的問題。
數(shù)據(jù)脫敏(Data Masking),又稱數(shù)據(jù)混淆、數(shù)據(jù)漂白、數(shù)據(jù)去隱私化,是一種為用戶提供虛假數(shù)據(jù),防止真實(shí)敏感數(shù)據(jù)被非法使用的技術(shù)。數(shù)據(jù)脫敏能夠保護(hù)企業(yè)敏感數(shù)據(jù)不被非法泄漏或?yàn)E用,是目前數(shù)據(jù)安全防護(hù)的首選方案之一。
數(shù)據(jù)脫敏通常包括靜態(tài)數(shù)據(jù)脫敏(Static Data Masking)和動(dòng)態(tài)數(shù)據(jù)脫敏(Dynamic Data Masking):靜態(tài)數(shù)據(jù)脫敏通常用于非生產(chǎn)環(huán)境,將脫敏后的數(shù)據(jù)分發(fā)至生產(chǎn)、測(cè)試等環(huán)境,從而保障數(shù)據(jù)安全;而動(dòng)態(tài)數(shù)據(jù)脫敏則通常用于生產(chǎn)環(huán)境,可基于用戶的請(qǐng)求進(jìn)行實(shí)時(shí)數(shù)據(jù)脫敏,從而保障運(yùn)維、應(yīng)用系統(tǒng)、數(shù)據(jù)交換等業(yè)務(wù)場(chǎng)景下的數(shù)據(jù)安全。
第二章 產(chǎn)品介紹
2.1 產(chǎn)品概述
閃捷動(dòng)態(tài)數(shù)據(jù)脫敏系統(tǒng)是一款簡(jiǎn)單高效的敏感數(shù)據(jù)匿名化、去標(biāo)識(shí)化產(chǎn)品,具備高性能和高擴(kuò)展性,支持多種脫敏算法,能夠定義敏感數(shù)據(jù)特征,對(duì)數(shù)據(jù)進(jìn)行分類分級(jí),發(fā)現(xiàn)敏感數(shù)據(jù)后可自動(dòng)創(chuàng)建脫敏規(guī)則,提供不同角色訪問生產(chǎn)環(huán)境的敏感數(shù)據(jù)的差異化管控。
在應(yīng)用側(cè),無需改造業(yè)務(wù)系統(tǒng),無需修改數(shù)據(jù)庫及存儲(chǔ)數(shù)據(jù),即可保證脫敏后的數(shù)據(jù)保留原有特征和分布,使企業(yè)可以低成本、高效率、安全地使用生產(chǎn)的隱私數(shù)據(jù);在運(yùn)維側(cè),基于角色對(duì)敏感數(shù)據(jù)高效漂白,保證運(yùn)維工作正常開展的同時(shí),又能夠兼顧數(shù)據(jù)安全,可廣泛適用于金融、保險(xiǎn)、能源、政府、醫(yī)療、教育等行業(yè),在滿足企業(yè)自身數(shù)據(jù)安全需求的同時(shí),滿足政策合規(guī)性要求。
此外,閃捷動(dòng)態(tài)數(shù)據(jù)脫敏系統(tǒng)支持與數(shù)據(jù)治理平臺(tái)、數(shù)據(jù)網(wǎng)關(guān)對(duì)接,能夠?qū)?span style="font-family: "Times New Roman";">API形式調(diào)用敏感數(shù)據(jù)的行為進(jìn)行監(jiān)控,自動(dòng)分析是否包含敏感數(shù)據(jù),結(jié)合中臺(tái)應(yīng)用系統(tǒng)層級(jí)的細(xì)粒度管控機(jī)制,可對(duì)敏感數(shù)據(jù)部分按照既定規(guī)則進(jìn)行實(shí)時(shí)的動(dòng)態(tài)數(shù)據(jù)脫敏,充分保護(hù)應(yīng)用系統(tǒng)/API服務(wù)中的敏感數(shù)據(jù)。
閃捷動(dòng)態(tài)數(shù)據(jù)脫敏系統(tǒng)支持硬件、軟件和虛擬化三種部署形態(tài),且支持市面大部分?jǐn)?shù)據(jù)源類型:
(1) 主流數(shù)據(jù)庫:Oracle、SQL Server、MySQL、PostgreSQL、DB2、Informix;
(2) 國(guó)產(chǎn)數(shù)據(jù)庫:達(dá)夢(mèng)、人大金倉、神通、GuassDB A、GaussDB T,Gbase,TDSQL、Tbase;
(3) 數(shù)據(jù)倉庫:GreenPlum、Teradata;
(4) NOSQL數(shù)據(jù)庫:ElasticSearch、MaxCompute、Hbase、Phoenix、Hive、Kudu
(5) API網(wǎng)關(guān):JSON/XML/HTML格式;
2.2 技術(shù)原理
針對(duì)不同數(shù)據(jù)源,動(dòng)態(tài)數(shù)據(jù)脫敏主要有兩種技術(shù)方案。
? 改寫SQL方案
通過SQL重寫實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)脫敏:
圖2-1 改寫SQL方案
這種技術(shù)方案脫敏效率高,關(guān)系型數(shù)據(jù)庫可直接進(jìn)行改寫,在數(shù)據(jù)庫通訊協(xié)議層面實(shí)現(xiàn)了完全透明的、實(shí)時(shí)的敏感數(shù)據(jù)掩碼能力,但某些大數(shù)據(jù)平臺(tái)需要安裝UDF才可進(jìn)行SQL改寫,適用場(chǎng)景稍窄。
? 改寫返回?cái)?shù)據(jù)集方案
通過改寫返回?cái)?shù)據(jù)集實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)脫敏:
圖2-2 改寫數(shù)據(jù)集方案
該方法可動(dòng)態(tài)地對(duì)生產(chǎn)數(shù)據(jù)庫返回的數(shù)據(jù)進(jìn)行差異化脫敏,效率稍低,但兼容性更高,適用場(chǎng)景更廣,可支持大數(shù)據(jù)平臺(tái)、API接口等多種數(shù)據(jù)源的脫敏需求。
2.3產(chǎn)品架構(gòu)
圖2-3 產(chǎn)品架構(gòu)圖
第三章 產(chǎn)品主要功能
3.1 數(shù)據(jù)資產(chǎn)管理
資產(chǎn)管理包含數(shù)據(jù)源管理、資產(chǎn)狀態(tài)和敏感數(shù)據(jù)訪問統(tǒng)計(jì)三個(gè)功能模塊。
數(shù)據(jù)源管理模塊主要用于添加、維護(hù)、查看需要進(jìn)行敏感數(shù)據(jù)防護(hù)的數(shù)據(jù)源。支持添加、刪除和修改數(shù)據(jù)資產(chǎn)信息,并支持對(duì)添加的數(shù)據(jù)資產(chǎn)進(jìn)行連接測(cè)試,便于確認(rèn)數(shù)據(jù)資產(chǎn)與動(dòng)態(tài)數(shù)據(jù)脫敏服務(wù)的映射關(guān)系,保證脫敏服務(wù)的正常使用。
資產(chǎn)狀態(tài)模塊用于展示數(shù)據(jù)源的狀態(tài)信息。包括數(shù)據(jù)源內(nèi)數(shù)據(jù)統(tǒng)計(jì)信息、不同模版下的敏感數(shù)據(jù)定義、敏感數(shù)據(jù)發(fā)現(xiàn)可視化結(jié)果、脫敏規(guī)則不同維度統(tǒng)計(jì)信息等,且資產(chǎn)狀態(tài)支持定期/手動(dòng)更新(減少服務(wù)器壓力),及數(shù)據(jù)源一鍵切換,可快捷查看其他數(shù)據(jù)源相關(guān)信息。
圖3-1 數(shù)據(jù)資產(chǎn)狀態(tài)
敏感數(shù)據(jù)訪問統(tǒng)計(jì)模塊幫助用戶統(tǒng)計(jì)數(shù)據(jù)資產(chǎn)中敏感數(shù)據(jù)訪問信息,包括數(shù)據(jù)庫用戶名、訪問IP、訪問數(shù)據(jù)目標(biāo)及敏感數(shù)據(jù)訪問次數(shù),直觀的統(tǒng)計(jì)信息可協(xié)助用戶開展針對(duì)性數(shù)據(jù)管理,高效保障數(shù)據(jù)資產(chǎn)安全。數(shù)據(jù)源管理模塊也可直接查看相關(guān)資產(chǎn)的訪問流量信息。
3.2 敏感數(shù)據(jù)發(fā)現(xiàn)
添加數(shù)據(jù)資產(chǎn)后,數(shù)據(jù)發(fā)現(xiàn)模塊會(huì)自動(dòng)添加一條針對(duì)該資產(chǎn)的數(shù)據(jù)發(fā)現(xiàn)掃描任務(wù),用戶無需再手動(dòng)新建任務(wù),用戶只需根據(jù)需求進(jìn)行任務(wù)配置的修改,包括抽樣數(shù)量、需要掃描的模式/表/視圖、需要發(fā)現(xiàn)的數(shù)據(jù)類型、是否需要根據(jù)行業(yè)模版進(jìn)行掃描等,最大程度簡(jiǎn)化任務(wù)配置操作,減少用戶工作量。系統(tǒng)通過掃描引擎發(fā)現(xiàn)數(shù)據(jù)資產(chǎn)中的敏感數(shù)據(jù)后,用戶可基于掃描結(jié)果直接單條/批量創(chuàng)建脫敏規(guī)則,方便快捷。
3.3 高效脫敏
系統(tǒng)內(nèi)置豐富的敏感數(shù)據(jù)類型特征庫,特征庫里包含常見的敏感數(shù)據(jù)類型,例如:中文姓名、身份證號(hào)、固定電話、手機(jī)號(hào)碼、銀行卡號(hào)、電子郵箱、中文地址、郵政編碼、企業(yè)單位名稱、組織機(jī)構(gòu)代碼、營(yíng)業(yè)執(zhí)照代碼、稅務(wù)登記代碼、企業(yè)三證合一代碼等共二十余種,可充分滿足常見場(chǎng)景脫敏需求。此外,系統(tǒng)支持通過正則表達(dá)式自定義添加敏感數(shù)據(jù)類型,滿足用戶特殊業(yè)務(wù)場(chǎng)景下的脫敏需求。敏感數(shù)據(jù)特征庫支持上傳離線包一鍵更新升級(jí),更新便捷。
l 數(shù)據(jù)分類分級(jí)
用戶也可以對(duì)所有不同類型的數(shù)據(jù)(內(nèi)置或自定義添加)進(jìn)行分類分級(jí)操作,自定義添加數(shù)據(jù)類別(例如身份信息類、金額類等),和敏感等級(jí)(高、中、低),根據(jù)自身業(yè)務(wù)特征,隨意組合不同類型、不同類別和不同敏感等級(jí)的數(shù)據(jù),自定義脫敏算法,生成可復(fù)用的方案模板進(jìn)行高效脫敏。
圖3-2 數(shù)據(jù)分類分級(jí)預(yù)覽
l 存儲(chǔ)過程脫敏
閃捷動(dòng)態(tài)數(shù)據(jù)脫敏系統(tǒng)支持對(duì)存儲(chǔ)過程中的語句進(jìn)行掃描,確定敏感字段,對(duì)包含脫敏規(guī)則敏感字段的語句進(jìn)行分析,實(shí)現(xiàn)動(dòng)態(tài)數(shù)據(jù)脫敏。防止脫敏繞過。
l 脫敏算法介紹
閃捷動(dòng)態(tài)數(shù)據(jù)脫敏系統(tǒng)內(nèi)置豐富高效的脫敏算法,主要可分為遮蔽、隨機(jī)、仿真、置空四大類算法。
? 遮蔽脫敏:通過*等特殊常量符號(hào),把全部/部分信息內(nèi)容遮蓋。例如:"張三"--->部分遮蔽--->"*三";張三"--->全遮蔽--->"**"
? 隨機(jī)脫敏:將數(shù)據(jù)進(jìn)行隨機(jī)映射,每次隨機(jī)值會(huì)變化。例如:"張三"--->隨機(jī)脫敏1--->"李四";"張三"--->隨機(jī)脫敏2--->"王五"
? 仿真脫敏:將數(shù)據(jù)映射成唯一值,每次映射不改變,支持?jǐn)?shù)據(jù)的聚合和連接操作。例如:"張三"--->仿真脫敏1--->"李四";"張三"--->仿真脫敏2--->"李四"
? 置空脫敏:將敏感數(shù)據(jù)直接修改為NULL值,適用于對(duì)數(shù)據(jù)敏感要求較高的場(chǎng)景
圖3-2 內(nèi)置算法列表
上述四大類脫敏算法又根據(jù)二十多種內(nèi)置的敏感數(shù)據(jù)類型,組合成了九十余種最常用的脫敏算法,豐富的算法庫可滿足大多數(shù)用戶各類場(chǎng)景下的脫敏需求,減少用戶根據(jù)實(shí)際需求編寫自定義算法的過程,保證產(chǎn)品易用性,減少用戶脫敏算法配置工作,提高業(yè)務(wù)效率。
l 行業(yè)模板
閃捷動(dòng)態(tài)數(shù)據(jù)脫敏系統(tǒng)具備豐富的實(shí)施案例和長(zhǎng)期技術(shù)積累,根據(jù)行業(yè)特征,總結(jié)了具有普適性的行業(yè)模版,供用戶直接使用,用戶也可根據(jù)自身的業(yè)務(wù)需求制定模版進(jìn)行復(fù)用。該模塊是閃捷動(dòng)態(tài)數(shù)據(jù)脫敏系統(tǒng)的特色功能之一,可以幫助客戶快速的實(shí)現(xiàn)敏感數(shù)據(jù)的定義和脫敏規(guī)則的創(chuàng)建,大幅簡(jiǎn)化脫敏系統(tǒng)的配置/維護(hù)成本。
l 脫敏規(guī)則
脫敏規(guī)則決定了敏感數(shù)據(jù)的脫敏結(jié)果。
創(chuàng)建脫敏規(guī)則的方法有以下三種:
1、通過敏感數(shù)據(jù)發(fā)現(xiàn)結(jié)果進(jìn)行創(chuàng)建;
2、通過關(guān)聯(lián)行業(yè)模版功能來實(shí)現(xiàn)自動(dòng)創(chuàng)建;
3、輸入?yún)?shù)手動(dòng)單條/批量創(chuàng)建;
3.4 訪問控制
白名單-----基于角色的脫敏控制
用戶可以設(shè)定數(shù)據(jù)庫用戶、IP、時(shí)間,在此訪問范圍內(nèi)可跳過一條/多條指定規(guī)則或者全部規(guī)則的脫敏動(dòng)作,滿足需要減少一定程度脫敏效果或者需要得到未脫敏數(shù)據(jù)的使用場(chǎng)景。
拓展規(guī)則--------基于角色的訪問權(quán)限控制
用戶可根據(jù)需求設(shè)定數(shù)據(jù)庫用戶名、IP、時(shí)間、匹配條件下的響應(yīng)動(dòng)作,包括替換表名、阻斷、替換SQL、搜索并替換字符串等,限制上述條件下對(duì)敏感表/數(shù)據(jù)的訪問權(quán)限。