دانلود مقاله ISI انگلیسی شماره 46635
ترجمه فارسی عنوان مقاله

شیوه ای برای حفاظت از نقض حریم خصوصی و نشت اطلاعات در داده کاوی حساس

عنوان انگلیسی
An approach for prevention of privacy breach and information leakage in sensitive data mining ☆
کد مقاله سال انتشار تعداد صفحات مقاله انگلیسی
46635 2015 7 صفحه PDF
منبع

Publisher : Elsevier - Science Direct (الزویر - ساینس دایرکت)

Journal : Computers & Electrical Engineering, Volume 45, July 2015, Pages 134–140

فهرست مطالب ترجمه فارسی
چکیده

کلمات کلیدی

1.مقدمه

1-1 شناساگر 

2-1 شبه شناساگر 

3-1 ویژگیهای خروجی محرمانه 

4-1 ویژگیهای خروجی غیر محرمانه

2- جمع آوری و انتشار داده 

شکل 1 – جمع اوری داده و انتشار داده 

3- چارچوب حریم خصوصی 

1-3 ناشناس k 

شکل 2- چارچوب حریم خصوصی – پنج مرحله داده کاوی با حفظ حریم خصوصی 

3-2- محدودیتهای شیوه های موجود 

3-3شیوه ناشناس شخصی شده 

4-نتایج تجربی 

شکل 3- کارایی با توجه به اندازه های مختلف شبه شناساگر  

شکل 4- کارایی با توجه به مقادیر مختلف i وk 

5-نتیجه گیری 
ترجمه کلمات کلیدی
هویت پنهان - داده کاوی - حریم خصوصی - حفظ حریم خصوصی - تکنیک های حفظ حریم خصوصی - چاپ و نشر اطلاعات حساس
کلمات کلیدی انگلیسی
Anonymization; Data mining; Privacy; Privacy preserving; Privacy preserving techniques; Sensitive data publishing
ترجمه چکیده
سازمانهای دولتی و شاید سازمانهای غیر دولتی اغلب نیاز به انتشار داده های حساسی دارند که حاوی اطلاعات درباره افراد است. داده های حسای یا داده های خصوصی، منبع مهمی از اطلاعات برای نهادهایی مانند سازمان دولتی و غیر دولتی برای تحقیق و تخصیص بودجه های عمومی، تحقیق پزشکی و تحلیل روند است. مسئله مهم در اینجا انتشار داده ها بدون ظاهر ساختن اطلاعات حساس افراد باشند. این اطلاعات خصوصی یا حساس هر فرد برای مخازن داده زیادی مانند داده های پزشکی، داده های سرشماری، داده ثبت رای، داده شبکه اجتماعی و داده ها مشتری، ضروری هستند. در این مقاله، شیوه ناشناس سازی شخصی شده پیشنهاد شده است که از حریم خصوصی حفاظت کرده و در عین حال داده های حساس منتشر می شود. سهم اصلی این مقاله در سه زمینه است : 1- تعریف فرایند تخصیص و انتشار داده 2- مدل چارچوب حریم خصوصی – شیوه ناشناس سازی شخصی شده. تحلیل تجربی در انتها ارائه شده، مشخص شده است که این شیوه روی معیار تمایز- تنوع، معیار تنوع احتمالی و ناشناسی K با معیار نزدیکی t بهتر عمل می کند.
ترجمه مقدمه
داده های جمع آوری شده به وسیله سازمانهای عمومی و سازمانهای خصوصی، هر روزدر حال افزایش بوده و در مخازن الکترونیک ذخیره می شوند. داده های در حال جمع آوری، شامل داده های حساس و خصوصی است. شیوه های بیشتر و بیشتر داده کاوی امروزه بوجود آمده و این شیوه ها را می توان برای ارزیابی فرایند تصمیم گیری استفاده کرد. شیوه های داده کاوی برای استخراج دانش نهفته از مجموعه های عظیم داده در شکل روندها، مدلها و الگوها استفاده شده اند. در حالی که انجام داده کاوی، داده های فردی را پردازش می کند که باید از نگرانی های حریم خصوصی محافظت شوند. حریم خصوصی یعنی اینکه اطلاعات فردی شناخته شده به عنوان داده حساس باید در حین انتشار داده ها حفاظت شود. در دیدگاه Schoeman [5] سه تعریف احتمالی حریم خصوصی پیشنهاد شده است : - حریم خصوصی حق هر فرد است. فرد می تواند تصمیم بگیرد کدام اطلاعات فردی باید با دیگران به اشتراک گذاشته شود. - حریم خصوصی دسترسی محدود به فرد و هر ویزگی یا تمام ویژگیهای مرتبط با یک فرد است. - حریم خصوصی یعنی مدیریت دسترسی به داده ها یا اطلاعات مربوط به خود فرد. در تعاریف بالا دانش استنتاج شده، انتشار اطلاعات کنترل شده است، بدین معنی که داده های فردی باید مخفی باشند، درحالی که برای تحقیق و سایر اهداف منتشر می شوند. داده های خرد یا داده های حساس، داده های خصوصی فردی مانند حقوق، سن، اطلاعات پزشکی و غیره است. مجموعه داده های خرد را می توان به عنوان فایلی با n رکورد درنظر گرفت، درحالی که هر رکورد حاوی m ویژگی است. ویژگیها را می توان به صورت زیر طبقه بندی کرد :
پیش نمایش مقاله
پیش نمایش مقاله  شیوه ای برای حفاظت از نقض حریم خصوصی و نشت اطلاعات در داده کاوی حساس

چکیده انگلیسی

Government agencies and many non-governmental organizations often need to publish sensitive data that contain information about individuals. The sensitive data or private data is an important source of information for the agencies like government and non-governmental organization for research and allocation of public funds, medical research and trend analysis. The important problem here is publishing data without revealing the sensitive information of individuals. This sensitive or private information of any individual is essential to several data repositories like medical data, census data, voter registration data, social network data and customer data. In this paper a personalized anonymization approach is proposed which preserves the privacy while the sensitive data is published. The main contributions of this paper are three folds: (i) the definition of the data collection and publication process, (ii) the privacy framework model and (iii) personalized anonymization approach. The experimental analysis is presented at the end; it shows this approach performs better over the distinct l-diversity measure, probabilistic l-diversity measure and k-anonymity with t-closeness measure.