1. Мәліметтерді маскировкалау түсінігі
Деректерді бүркемелеу деректерді маскировка ретінде де белгілі. Бұл ұялы телефон нөмірі, банк картасының нөмірі және басқа ақпарат сияқты құпия деректерді түрлендірудің, өзгертудің немесе жабудың техникалық әдісі. Бұл әдіс негізінен құпия деректердің сенімсіз орталарда тікелей пайдаланылуын болдырмау үшін қолданылады.
Деректерді бүркемелеу принципі: Деректерді бүркемелеу кейіннен әзірлеуге, тестілеуге және деректерді талдауға бүркеніш әсер етпейтініне көз жеткізу үшін бастапқы деректер сипаттамаларын, бизнес ережелерін және деректер сәйкестігін сақтауы керек. Маскадан бұрын және кейін деректердің сәйкестігі мен жарамдылығын қамтамасыз етіңіз.
2. Мәліметтерді маскировка классификациясы
Деректерді бүркемелеуді статикалық деректерді маскалау (SDM) және динамикалық деректерді маскалау (DDM) деп бөлуге болады.
Статикалық деректерді маскалау (SDM): Статикалық деректерді бүркемелеу өндірістік ортадан оқшаулау үшін жаңа өндірістік емес орта дерекқорын құруды талап етеді. Маңызды деректер өндірістік дерекқордан алынады, содан кейін өндірістік емес дерекқорда сақталады. Осылайша, десенсибилизацияланған деректер бизнес қажеттіліктерін қанағаттандыратын және өндірістік деректердің қауіпсіздігін қамтамасыз ететін өндірістік ортадан оқшауланады.
Динамикалық деректерді маскалау (DDM): Ол әдетте нақты уақытта сезімтал деректерді сенсибилизациялау үшін өндірістік ортада қолданылады. Кейде әртүрлі жағдайларда бірдей құпия деректерді оқу үшін бүркеніштің әртүрлі деңгейлері қажет. Мысалы, әртүрлі рөлдер мен рұқсаттар әртүрлі бүркемелеу схемаларын жүзеге асыруы мүмкін.
Деректер туралы есеп беру және деректер өнімдерін маскировкалау қолданбасы
Мұндай сценарийлер негізінен ішкі деректерді бақылау өнімдерін немесе билбордты, сыртқы қызмет деректер өнімдерін және бизнес есептер мен жобаны шолу сияқты деректерді талдауға негізделген есептерді қамтиды.
3. Мәліметтерді маскировкалау шешімі
Мәліметтерді маскировкалаудың жалпы схемаларына мыналар жатады: жарамсыздандыру, кездейсоқ мән, деректерді ауыстыру, симметриялық шифрлау, орташа мән, ығысу және дөңгелектеу және т.б.
Жарамсыз деп тану: Жарамсыз деп танылған құпия деректерді шифрлауға, қысқартуға немесе жасыруға жатады. Бұл схема әдетте нақты деректерді арнайы белгілермен (мысалы, *) ауыстырады. Операция қарапайым, бірақ пайдаланушылар бастапқы деректердің пішімін біле алмайды, бұл кейінгі деректер қолданбаларына әсер етуі мүмкін.
Кездейсоқ мән: Кездейсоқ мән құпия деректерді кездейсоқ ауыстыруды білдіреді (сандар цифрларды ауыстырады, әріптер әріптерді және таңбалар таңбаларды ауыстырады). Бұл бүркемелеу әдісі белгілі бір дәрежеде құпия деректердің пішімін қамтамасыз етеді және деректерді кейінгі қолдануды жеңілдетеді. Адамдар мен жер атаулары сияқты кейбір мағыналы сөздер үшін бүркеніш сөздіктер қажет болуы мүмкін.
Деректерді ауыстыру: Деректерді ауыстыру нөлдік және кездейсоқ мәндерді маскировкалауға ұқсас, тек арнайы таңбаларды немесе кездейсоқ мәндерді пайдаланудың орнына маска деректері белгілі бір мәнмен ауыстырылады.
Симметриялық шифрлау: Симметриялық шифрлау – арнайы қайтымды бүркемелеу әдісі. Ол құпия деректерді шифрлау кілттері мен алгоритмдер арқылы шифрлайды. Шифрленген мәтін пішімі логикалық ережелердегі бастапқы деректермен сәйкес келеді.
Орташа: Орташа схема жиі статистикалық сценарийлерде қолданылады. Сандық деректер үшін біз алдымен олардың орташа мәнін есептейміз, содан кейін орташа мәннің айналасында десенсибилизацияланған мәндерді кездейсоқ түрде таратамыз, осылайша деректердің қосындысын тұрақты түрде сақтаймыз.
Офсет және дөңгелектеу: Бұл әдіс сандық деректерді кездейсоқ ауыстыру арқылы өзгертеді. Офсеттік дөңгелектеу деректердің қауіпсіздігін сақтай отырып, диапазонның шамамен түпнұсқалығын қамтамасыз етеді, бұл алдыңғы схемаларға қарағанда нақты деректерге жақын және үлкен деректерді талдау сценарийінде үлкен мәнге ие.
Ұсынылатын үлгі»ML-NPB-5660Деректерді бүркемелеу үшін
4. Жиі қолданылатын деректерді маскалау әдістері
(1). Статистикалық әдістер
Деректерді іріктеу және деректерді біріктіру
- Деректерді іріктеу: деректер жиынының өкілді ішкі жиынын таңдау арқылы бастапқы деректер жинағын талдау және бағалау идентификациясыздандыру әдістерінің тиімділігін арттырудың маңызды әдісі болып табылады.
- Деректерді біріктіру: микродеректердегі атрибуттарға қолданылатын статистикалық әдістердің (қосыну, санау, орташалау, максимум және минимум сияқты) жиынтығы ретінде нәтиже бастапқы деректер жинағындағы барлық жазбаларды көрсетеді.
(2). Криптография
Криптография - десенсибилизацияның тиімділігін арттырудың кең таралған әдісі. Шифрлау алгоритмдерінің әртүрлі түрлері әртүрлі десенсибилизация әсерлеріне қол жеткізе алады.
- Детерминистік шифрлау: кездейсоқ емес симметриялық шифрлау. Ол әдетте идентификатор деректерін өңдейді және қажет болған жағдайда шифрды мәтінді бастапқы идентификаторға шеше алады, бірақ кілт дұрыс қорғалуы керек.
- Қайтымсыз шифрлау: хэш функциясы деректерді өңдеу үшін пайдаланылады, әдетте ID деректері үшін пайдаланылады. Оны тікелей шифрдан шығару мүмкін емес және салыстыру қатынасын сақтау керек. Сонымен қатар, хэш функциясының ерекшелігіне байланысты деректер соқтығысуы мүмкін.
- Гомоморфты шифрлау: шифрлық мәтіндік гомоморфты алгоритм қолданылады. Оның сипаттамасы шифрлық мәтін операциясының нәтижесі шифрды шешуден кейінгі ашық мәтіндік операцияның нәтижесімен бірдей. Сондықтан ол әдетте сандық өрістерді өңдеу үшін пайдаланылады, бірақ өнімділік себептері бойынша кеңінен қолданылмайды.
(3). Жүйелік технология
Басу технологиясы құпиялылықты қорғауға сәйкес келмейтін деректер элементтерін жояды немесе қорғайды, бірақ оларды жарияламайды.
- Маскировка: ол қарсыластың нөмірі, жеке куәлік жұлдызшамен белгіленген немесе мекенжай қысқартылған сияқты атрибут мәнін бүркемелеу үшін ең көп таралған десенсибилизация әдісіне жатады.
- Жергілікті басу: нақты атрибут мәндерін (бағандарын) жою, маңызды емес деректер өрістерін жою процесін білдіреді;
- Жазбаларды басу: нақты жазбаларды (жолдарды) жою, маңызды емес деректер жазбаларын жою процесін білдіреді.
(4). Технология лақап аты
Псевдоманнинг - тікелей идентификаторды (немесе басқа сезімтал идентификаторды) ауыстыру үшін бүркеншік атын пайдаланатын де-идентификаторлық әдіс. Бүркеншік ат әдістері тікелей немесе сезімтал идентификаторлардың орнына әрбір жеке ақпарат субъектісі үшін бірегей идентификаторларды жасайды.
- Ол бастапқы идентификаторға сәйкес кездейсоқ мәндерді дербес жасай алады, салыстыру кестесін сақтай алады және салыстыру кестесіне қол жеткізуді қатаң басқара алады.
- Сіз сондай-ақ бүркеншік аттарды жасау үшін шифрлауды пайдалана аласыз, бірақ шифрды шешу кілтін дұрыс сақтау қажет;
Бұл технология ашық платформа сценарийіндегі OpenID сияқты көптеген тәуелсіз деректерді пайдаланушылар жағдайында кеңінен қолданылады, мұнда әртүрлі әзірлеушілер бір пайдаланушы үшін әртүрлі Openids алады.
(5). Жалпылау әдістері
Жалпылау әдісі деректер жиынындағы таңдалған атрибуттардың түйіршіктілігін төмендететін және деректердің неғұрлым жалпы және абстрактілі сипаттамасын беретін сәйкестендіруді жою әдісіне жатады. Жалпылау технологиясын енгізу оңай және жазба деңгейіндегі деректердің түпнұсқалығын қорғай алады. Ол әдетте деректер өнімдерінде немесе деректер есептерінде қолданылады.
- Дөңгелектеу: 100, 500, 1K және 10K нәтижелерін беретін жоғары немесе төмен криминалистика сияқты таңдалған атрибут үшін дөңгелектеу негізін таңдауды қамтиды.
- Үстіңгі және төменгі кодтау әдістері: шекті мәннен жоғары (немесе төмен) мәндерді жоғарғы (немесе төменгі) деңгейді білдіретін шекпен ауыстырыңыз, нәтижесінде «X жоғары» немесе «X төмен» нәтиже береді.
(6). Рандомизация әдістері
Сәйкестендіру әдісінің бір түрі ретінде рандомизация технологиясы рандомизациядан кейінгі мән бастапқы нақты мәннен өзгеше болатындай етіп атрибут мәнін рандомизация арқылы өзгертуді білдіреді. Бұл процесс шабуылдаушының сол деректер жазбасындағы басқа төлсипат мәндерінен төлсипат мәнін алу мүмкіндігін азайтады, бірақ нәтиже деректерінің түпнұсқалығына әсер етеді, бұл өндірістік сынақ деректерімен ортақ.
Жіберу уақыты: 27 қыркүйек 2022 ж