1. Деректерді жасыру тұжырымдамасы
Деректерді жасыру деректерді жасыру деп те аталады. Бұл жасыру ережелері мен саясатын берген кезде ұялы телефон нөмірі, банк картасының нөмірі және басқа ақпарат сияқты құпия деректерді түрлендіру, өзгерту немесе жасырудың техникалық әдісі. Бұл әдіс негізінен құпия деректердің сенімсіз ортада тікелей пайдаланылуына жол бермеу үшін қолданылады.
Деректерді жасыру қағидаты: Деректерді жасыру бастапқы деректер сипаттамаларын, бизнес ережелерін және деректердің өзектілігін сақтауы керек, бұл кейінгі әзірлеуге, тестілеуге және деректерді талдауға жасыру әсер етпейтініне көз жеткізуі керек. Жасыру алдында және кейін деректердің сәйкестігі мен жарамдылығын қамтамасыз ету.
2. Деректерді жасырудың жіктелуі
Деректерді жасыруды статикалық деректерді жасыру (SDM) және динамикалық деректерді жасыру (DDM) деп бөлуге болады.
Статикалық деректерді бүркеу (SDM)Статикалық деректерді жасыру өндірістік ортадан оқшаулау үшін жаңа өндірістік емес орта дерекқорын құруды талап етеді. Құпия деректер өндірістік дерекқордан алынады, содан кейін өндірістік емес дерекқорда сақталады. Осылайша, сезімталдығы төмендетілген деректер өндірістік ортадан оқшауланады, бұл бизнес қажеттіліктерін қанағаттандырады және өндірістік деректер қауіпсіздігін қамтамасыз етеді.
Динамикалық деректерді жасыру (DDM)Ол әдетте өндірістік ортада нақты уақыт режимінде құпия деректердің сезімталдығын төмендету үшін қолданылады. Кейде әртүрлі жағдайларда бірдей құпия деректерді оқу үшін әртүрлі деңгейдегі жасыру қажет болады. Мысалы, әртүрлі рөлдер мен рұқсаттар әртүрлі жасыру схемаларын енгізуі мүмкін.
Деректер туралы есеп беру және деректер өнімдерін жасыру қолданбасы
Мұндай сценарийлерге негізінен ішкі деректерді бақылау өнімдері немесе билбордтар, сыртқы қызмет деректері өнімдері және бизнес есептер мен жобаларды шолу сияқты деректерді талдауға негізделген есептер кіреді.
3. Деректерді жасыру шешімі
Деректерді жасырудың кең таралған схемаларына мыналар жатады: жарамсыздық, кездейсоқ мән, деректерді ауыстыру, симметриялы шифрлау, орташа мән, ығысу және дөңгелектеу және т.б.
Жарамсыз деп тануЖарамсыздандыру құпия деректерді шифрлауды, қысқартуды немесе жасыруды білдіреді. Бұл схема әдетте нақты деректерді арнайы таңбалармен (мысалы, *) ауыстырады. Операция қарапайым, бірақ пайдаланушылар бастапқы деректердің пішімін біле алмайды, бұл кейінгі деректер қолданбаларына әсер етуі мүмкін.
Кездейсоқ мәнКездейсоқ мән құпия деректердің кездейсоқ ауыстырылуын білдіреді (сандар цифрлардың, әріптер әріптердің, ал таңбалар таңбалардың орнына қолданылады). Бұл жасыру әдісі құпия деректердің пішімін белгілі бір дәрежеде қамтамасыз етеді және деректерді кейінгі қолдануды жеңілдетеді. Адамдар мен жерлердің атаулары сияқты кейбір мағыналы сөздер үшін жасыру сөздіктері қажет болуы мүмкін.
Деректерді ауыстыруДеректерді ауыстыру нөлдік және кездейсоқ мәндерді жасыруға ұқсас, тек арнайы таңбаларды немесе кездейсоқ мәндерді пайдаланудың орнына жасырын деректер белгілі бір мәнмен ауыстырылады.
Симметриялық шифрлауСимметриялық шифрлау - арнайы қайтымды маскалау әдісі. Ол құпия деректерді шифрлау кілттері мен алгоритмдері арқылы шифрлайды. Шифр мәтінінің форматы логикалық ережелердегі бастапқы деректермен сәйкес келеді.
ОрташаОрташа схема статистикалық сценарийлерде жиі қолданылады. Сандық деректер үшін алдымен олардың орташа мәнін есептейміз, содан кейін сезімталдығы төмендетілген мәндерді орташа мәннің айналасында кездейсоқ түрде таратамыз, осылайша деректердің қосындысын тұрақты сақтаймыз.
Жылжыту және дөңгелектеуБұл әдіс сандық деректерді кездейсоқ ығысу арқылы өзгертеді. Ауыстыру дөңгелектеуі деректердің қауіпсіздігін сақтай отырып, диапазонның шамамен түпнұсқалығын қамтамасыз етеді, бұл алдыңғы схемаларға қарағанда нақты деректерге жақын және үлкен деректерді талдау сценарийінде үлкен маңызға ие.
Ұсынылатын модель «ML-NPB-5660«Деректерді жасыру үшін»
4. Деректерді жасырудың жиі қолданылатын әдістері
(1). Статистикалық әдістер
Деректерді іріктеу және деректерді агрегациялау
- Деректерді іріктеу: Деректер жиынтығының репрезентативтік ішкі жиынын таңдау арқылы бастапқы деректер жиынтығын талдау және бағалау сәйкестендіруді жою әдістерінің тиімділігін арттырудың маңызды әдісі болып табылады.
- Деректерді агрегациялау: Микродеректердегі атрибуттарға қолданылатын статистикалық әдістердің жиынтығы (мысалы, қорытындылау, санау, орташалау, максималды және минималды мәндер) ретінде нәтиже бастапқы деректер жиынындағы барлық жазбалардың репрезентативті нәтижесі болып табылады.
(2). Криптография
Криптография - сезімталдықты төмендету немесе десенсибилизацияның тиімділігін арттырудың кең таралған әдісі. Әр түрлі шифрлау алгоритмдері әртүрлі десенсибилизациялық әсерлерге қол жеткізе алады.
- Детерминистік шифрлау: Кездейсоқ емес симметриялы шифрлау. Әдетте ол идентификатор деректерін өңдейді және қажет болған жағдайда шифр мәтінін шифрдан шығарып, бастапқы идентификаторға қалпына келтіре алады, бірақ кілт тиісті түрде қорғалуы керек.
- Қайтымсыз шифрлау: Хэш функциясы деректерді өңдеу үшін қолданылады, ол әдетте идентификатор деректері үшін қолданылады. Оны тікелей шифрдан шығару мүмкін емес және салыстыру қатынасы сақталуы керек. Сонымен қатар, хэш функциясының мүмкіндігіне байланысты деректер соқтығысуы мүмкін.
- Гомоморфты шифрлау: Шифрлы мәтін гомоморфты алгоритмі қолданылады. Оның ерекшелігі - шифрлы мәтін операциясының нәтижесі дешифрдан кейін ашық мәтін операциясымен бірдей болады. Сондықтан, ол сандық өрістерді өңдеу үшін жиі қолданылады, бірақ өнімділік себептері бойынша кеңінен қолданылмайды.
(3). Жүйелік технология
Басу технологиясы құпиялылықты қорғауға сәйкес келмейтін деректер элементтерін жояды немесе қорғайды, бірақ оларды жарияламайды.
- Маскировка: бұл қарсылас нөмірі, жеке куәлік жұлдызшамен белгіленген немесе мекенжай қысқартылған сияқты атрибут мәнін маскировкалаудың ең көп таралған десенсибилизация әдісін білдіреді.
- Жергілікті басу: белгілі бір атрибут мәндерін (бағандарды) жою, маңызды емес деректер өрістерін жою процесін білдіреді;
- Жазбаларды басу: белгілі бір жазбаларды (жолдарды) жою, маңызды емес деректер жазбаларын жою процесін білдіреді.
(4). Бүркеншік ат технологиясы
Псевдоманнинг – тікелей идентификаторды (немесе басқа сезімтал идентификаторды) ауыстыру үшін бүркеншік атты пайдаланатын жеке басын анықтау әдісі. Бүркеншік аттар әрбір жеке ақпарат субъектісі үшін тікелей немесе сезімтал идентификаторлардың орнына бірегей идентификаторлар жасайды.
- Ол бастапқы идентификаторға сәйкес келетін кездейсоқ мәндерді тәуелсіз түрде жасай алады, картаға түсіру кестесін сақтай алады және картаға түсіру кестесіне кіруді қатаң басқара алады.
- Сондай-ақ, бүркеншік аттар жасау үшін шифрлауды пайдалануға болады, бірақ шифрды ашу кілтін дұрыс сақтау қажет;
Бұл технология көптеген тәуелсіз деректер пайдаланушылары жағдайында кеңінен қолданылады, мысалы, ашық платформа сценарийіндегі OpenID, мұнда әртүрлі әзірлеушілер бір пайдаланушы үшін әртүрлі Openid-терді алады.
(5). Жалпылау әдістері
Жалпылау әдісі деректер жиынындағы таңдалған атрибуттардың түйіршіктілігін азайтатын және деректердің жалпы және абстрактілі сипаттамасын беретін сәйкестендірусіздендіру әдісін білдіреді. Жалпылау технологиясын енгізу оңай және жазба деңгейіндегі деректердің шынайылығын қорғай алады. Ол көбінесе деректер өнімдерінде немесе деректер есептерінде қолданылады.
- Дөңгелектеу: таңдалған атрибут үшін дөңгелектеу негізін таңдауды қамтиды, мысалы, жоғары немесе төмен қарай криминалистика, бұл 100, 500, 1K және 10K нәтижелерін береді.
- Жоғарғы және төменгі кодтау әдістері: шекті мәннен жоғары (немесе төмен) мәндерді жоғарғы (немесе төменгі) деңгейді білдіретін шекті мәнмен ауыстырыңыз, нәтижесінде «X-тен жоғары» немесе «X-тен төмен» нәтижесін алыңыз.
(6). Кездейсоқтық әдістері
Анықтамасыздандыру әдісінің бір түрі ретінде рандомизация технологиясы кездейсоқтық арқылы атрибуттың мәнін өзгертуді білдіреді, осылайша кездейсоқтықтан кейінгі мән бастапқы нақты мәннен өзгеше болады. Бұл процесс шабуылдаушының сол деректер жазбасындағы басқа атрибут мәндерінен атрибут мәнін алу мүмкіндігін төмендетеді, бірақ өндірістік сынақ деректерінде жиі кездесетін нәтижелі деректердің түпнұсқалығына әсер етеді.
Жарияланған уақыты: 2022 жылғы 27 қыркүйек



