大数据管理概论

大数据管理概论大数据管理概论1大数据隐私1.1引言如今的数据主要大数据的类型隐私特征与类别大数据的隐私风险1.2隐私保护技术匿名化技术数据加密技术差分隐私技术隐私信息检索技术参考文献1大数据隐私1.1引言21世纪网络技术的发展使得个人的隐私无处可藏如今的数据主要大数据的类型1)原生数字化数据这类数据自然产生出来就适合计算机存储的和处理的数据。例如:电子邮件与文本信息,GPS位置数据,关…

大家好,又见面了,我是你们的朋友全栈君。

1 大数据隐私

1.1 引言

  • 21世纪网络技术的发展使得个人的隐私无处可藏

如今的数据主要大数据的类型

1)原生数字化数据
这类数据自然产生出来就适合计算机存储的和处理的数据。例如:电子邮件与文本信息,GPS位置数据,关联电话呼叫的元数据等等,这类数字化的数字信息可以被计算直接利用
2)原生模拟话数据
这类诗句一般为非结构话的数据,例如呼叫的音频与视频,个人健康数据,环境监测数据,超声波检测数据

隐私特征与类别

隐私的类别主要分为以下三类:
1)监视带来的隐私
2)披露带来的隐私:这类隐私是指故意或者无意中想不可信的第三方透露或者遗失数据。该类隐私通常利用匿名化,差分隐私,加密和访问空指技术来保护
3)歧视带来的隐私:大数据处理技术不透明,普通人无法感知和应用,会在无意有意中产生歧视结果

大数据的隐私风险

大数据处理框架 泄露
数据收集 例如在网上搜索医院时,会首先推荐附近医院。
数据集成与融合 在完整服务用户时,收集来自用户各类的消费记录,即使采用了模糊话,匿名化的操作,用户的信息还是容易被攻击者获取到
数据分析 分析用户的各种信息很容易就泄露数据的隐私
数据解释

1.2 隐私保护技术

匿名化技术

匿名化是指隐藏或者模糊数据以及数据源。该技术一般采用抑制,泛化,剖析,切片,分离等操作匿名化。有K-匿名l-diversity,t-closeness

数据加密技术

大数据隐私通常以云平台为依托,实现隐私管理。主要有同态加密,功能加密,安全多方计算等,安全多方计算核心操作是在分布式环境下基于多方参与者提供的数据计算出相应的函数值,并确保除了参与者的输入以及输出信息外,不会额外暴露参与方的任何信息。

差分隐私技术

参考差分隐私技术

隐私信息检索技术

参考文献

[1]孟小峰.大数据管理概论[M].机械工业出版社,2017

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/132697.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号