菜单
  
    摘要:随着数据量的增大,数据挖掘技术应用不断扩大,如何保护私有信息或是敏感知识在数据挖掘中不被泄露,同时又能较为准确的得到数据挖掘的结果显得尤为重要。本文从对数据挖掘与隐私保护领域的隐私概念的论述,从数据分布、数据修改、数据挖掘算法、数据及规则的隐藏、隐私保持五个角度对隐私保护技术进行了阐述,并且对隐私保护技术中出现的不足提出了解决方法,还给出了隐私保护挖掘算法性能的评估方法。
    关键词:数据挖掘;隐私保护;分布式数据
    The Research of Privacy Protection Technology in Data Mining
    Abstract:With the increasing of the data, The application of data mining technology continuously extension, it is very important that how to protect private information or sensitive knowledge are not to be leaked in data mining, and that people can accurately get the result of data mining at the same time. Based on the data mining and privacy protection in the field of privacy concept discussion, from the data distribution, data modification, data mining algorithms, data and rules, privacy preserving of five perspectives on privacy protection technology in detail, and on privacy protection technology where the shortage appeared in also put forward to the methods to solve, in addition, giving out privacy protection data mining algorithm performance evaluation method.
    Key words: Data mining; Privacy protection; Distributed data
    目录
    摘  要    1
    引言    2
    1.课题概述    2
    2.隐私保护技术    3
    2.1 数据分布方式    3
    2.2 数据修改方法    4
    2.3 数据挖掘算法    4
    2.4 数据与规则隐藏    4
    2.5 隐私保持    4
    2.5.1基于启发式的隐私保持技术    4
    2.5.2 基于密码学的隐私保持技术    5
    2.5.3 基于重构的隐私保持技术    5
    3.隐私保护技术存在的不足及解决方法    6
    4.隐私保护数据挖掘算法评估    6
    4.1算法效率    6
    4.2数据有用性    7
    4.3隐私保护程度    7
    5. 结束语    7
    参考文献    8
    致谢    9,4020
    数据挖掘中的隐私保护技术研究
        引言
    我们处在一个信息爆炸的大时代,计算机处理能力、存储技术以及互联网络的发展又极大地提高了信息的数字化处理程度,现代计算机硬件及网络技术的发展,不仅使得海量的个人信息、交易记录等数据能够得以方便的存储和查询,同时也促进了数据挖掘技术的发展。
    虽然,运用数据挖掘所得到的数据知识通常都代表了大部分数据记录的特性和整个数据集合的分布规律,但是具体的挖掘过程离不开对个体记录的逐一检索和计算。于是,现行挖掘算法对原始记录的依赖也就将原始数据直接暴露给了挖掘过程,任何参与者都能够接触到真实的数据,这也意着大部分的挖掘算法都存在着泄露隐私的可能。因此,为了保护数据中的敏感信息,我们需要一类能够保护隐私信息的挖掘方法,既能得到与传统算法等价的挖掘结果,又要使得用户的敏感数据不会泄露,难以被别有用心者获得,同时还要确保执行的效率。
    1.课题概述
    数据挖掘是用来对海量数据进行处理,从中抽取和发现感兴趣知识的有效手段,它可以使用户及时、准确地得到所需要的信息。数据挖掘将传统的数据分析方法与处理大量数据的复杂算法相结合,在大型数据存储库中,自动发现有用信息,探查大型数据库,发现未知有用模式,并且可对未来观测结果预测[1]。
  1. 上一篇:Flash射击游戏设计+需求分析
  2. 下一篇:面向主题的网络蜘蛛爬虫研究与设计+流程图
  1. 神经网络算法在核素识别中的应用研究

  2. 面向电商评论的数据挖掘技术与系统

  3. XML文档在组态软件中的应用

  4. 基于Agent的突发事件中网络...

  5. 网络新闻文本中的命名实体自动抽取研究

  6. 作业调度系统中的A*智能搜索算法研究与实现

  7. 关联规则算法分析数据挖掘研究

  8. 河岸冲刷和泥沙淤积的监测国内外研究现状

  9. 杂拟谷盗体内共生菌沃尔...

  10. 中考体育项目与体育教学合理结合的研究

  11. 十二层带中心支撑钢结构...

  12. 电站锅炉暖风器设计任务书

  13. 大众媒体对公共政策制定的影响

  14. 乳业同业并购式全产业链...

  15. java+mysql车辆管理系统的设计+源代码

  16. 当代大学生慈善意识研究+文献综述

  17. 酸性水汽提装置总汽提塔设计+CAD图纸

  

About

751论文网手机版...

主页:http://www.751com.cn

关闭返回