大家好,又见面了,我是你们的朋友全栈君。
与传统数据分析不同的是,数据挖掘技术在对信息进行挖掘和发现知识的过程中,没有明确的假设。它通过分析历史数据,建立数据模型,以预测未来的趋势和行为,并对此作出预测性判断。从庞大的数据库中发现隐藏的、有价值的信息是进行数据挖掘的主要目的,它的主要功能有:
1、能够预测未来趋势和行为的功能
以前需要进行大量手工分析的问题,现在运用数据挖掘技术就能够自动地在数据库中查找预测信息,并可以依据数据迅速地得出结论。就像预测销售金额一样,可以利用数据挖掘技术对以前促销的全部数据进行分析,就基本上可以锁定未来投资中有最大回报的客户等等。
2、聚类和概念描述
数据库中的数据可以划分成一系列有意义的集合,也就是聚类。它增强了人们对客观事实的认识,是概念描述的前提。概念描述就是描述某一类物体的本质,概括了这类物体的相关特性。
3、关联分析和偏差检测
数据关联是指在数据库中已经存在,能够被发现的一类别的信息。关联性就是指各变量的取值有一定的规律。关联分析就是要找出隐匿在数据库中的有彼此相关和联系的网络。由于库中数据的关联性既不明确又不确定性,因此相关分析结果是可信的。在数据库中,有时会出现异常偏差数据,如不符合规则的特殊情况、观测结果与模型预测值之间的偏差等,对此类数据的检测就具有重要意义。测量误差的一般方法是,找出观测值和参考值的差异,然后进行对比分析,给出参考结论。
数据挖掘技术还可能带来隐私披露、数据滥用等一系列问题,因此,必须规范数据挖掘技术的使用。同时,需要利用加密、访问控制和网络安全机制保护技术等技术手段来保护信息安全,以保证数据信息不被窃取、更改或秘密访问。
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/148155.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...