Java实现数据统计的常用算法

Java实现数据统计的常用算法Java实现数据统计的常用算法

大家好,又见面了,我是你们的朋友全栈君。

求和、平均值、众数、中位数、中列数、四分位数、极差、四分位数、截断均值、方差、绝对平均差(AAD)、中位数绝对偏差、标准差 的数学方法

package cn.javacodes.utils;
import java.util.Arrays;
import java.util.HashMap;
import java.util.Iterator;
import java.util.Map;
/** * 数据统计工具类 * @author 胡湛霏 * @since 2016-09-27 */
public class DataStatisticsUtils { 

/** * 求和 * * @param arr * @return */
public static double getSum(double[] arr) { 

double sum = 0;
for (double num : arr) { 

sum += num;
}
return sum;
}
/** * 求均值 * * @param arr * @return */
public static double getMean(double[] arr) { 

return getSum(arr) / arr.length;
}
/** * 求众数 * * @param arr * @return */
public static double getMode(double[] arr) { 

Map<Double, Integer> map = new HashMap<Double, Integer>();
for (int i = 0; i < arr.length; i++) { 

if (map.containsKey(arr[i])) { 

map.put(arr[i], map.get(arr[i]) + 1);
} else { 

map.put(arr[i], 1);
}
}
int maxCount = 0;
double mode = -1;
Iterator<Double> iter = map.keySet().iterator();
while (iter.hasNext()) { 

double num = iter.next();
int count = map.get(num);
if (count > maxCount) { 

maxCount = count;
mode = num;
}
}
return mode;
}
/** * 求中位数 * * @param arr * @return */
public static double getMedian(double[] arr) { 

double[] tempArr = Arrays.copyOf(arr, arr.length);
Arrays.sort(tempArr);
if (tempArr.length % 2 == 0) { 

return (tempArr[tempArr.length >> 1] + tempArr[(tempArr.length >> 1) - 1]) / 2;
} else { 

return tempArr[(tempArr.length >> 1)];
}
}
/** * 求中列数 * * @param arr * @return */
public static double getMidrange(double[] arr) { 

double max = arr[0], min = arr[0];
for (int i = 0; i < arr.length; i++) { 

if (arr[i] > max) { 

max = arr[i];
}
if (arr[i] < min) { 

min = arr[i];
}
}
return (min + max) / 2;
}
/** * 求四分位数 * * @param arr * @return 存放三个四分位数的数组 */
public static double[] getQuartiles(double[] arr) { 

double[] tempArr = Arrays.copyOf(arr, arr.length);
Arrays.sort(tempArr);
double[] quartiles = new double[3];
// 第二四分位数(中位数)
quartiles[1] = getMedian(tempArr);
// 求另外两个四分位数
if (tempArr.length % 2 == 0) { 

quartiles[0] = getMedian(Arrays.copyOfRange(tempArr, 0, tempArr.length / 2));
quartiles[2] = getMedian(Arrays.copyOfRange(tempArr, tempArr.length / 2, tempArr.length));
} else { 

quartiles[0] = getMedian(Arrays.copyOfRange(tempArr, 0, tempArr.length / 2));
quartiles[2] = getMedian(Arrays.copyOfRange(tempArr, tempArr.length / 2 + 1, tempArr.length));
}
return quartiles;
}
/** * 求极差 * * @param arr * @return */
public static double getRange(double[] arr) { 

double max = arr[0], min = arr[0];
for (int i = 0; i < arr.length; i++) { 

if (arr[i] > max) { 

max = arr[i];
}
if (arr[i] < min) { 

min = arr[i];
}
}
return max - min;
}
/** * 求四分位数极差 * * @param arr * @return */
public static double getQuartilesRange(double[] arr) { 

return getRange(getQuartiles(arr));
}
/** * 求截断均值 * * @param arr 求值数组 * @param p 截断量p,例如p的值为20,则截断20%(高10%,低10%) * @return */
public static double getTrimmedMean(double[] arr, int p) { 

int tmp = arr.length * p / 100;
double[] tempArr = Arrays.copyOfRange(arr, tmp, arr.length + 1 - tmp);
return getMean(tempArr);
}
/** * 求方差 * * @param arr * @return */
public static double getVariance(double[] arr) { 

double variance = 0;
double sum = 0, sum2 = 0;
for (int i = 0; i < arr.length; i++) { 

sum += arr[i];
sum2 += arr[i] * arr[i];
}
variance = sum2 / arr.length - (sum / arr.length) * (sum / arr.length);
return variance;
}
/** * 求绝对平均偏差(AAD) * * @param arr * @return */
public static double getAbsoluteAverageDeviation(double[] arr) { 

double sum = 0;
double mean = getMean(arr);
for (int i = 0; i < arr.length; i++) { 

sum += Math.abs(arr[i] - mean);
}
return sum / arr.length;
}
/** * 求中位数绝对偏差(MAD) * * @param arr * @return */
public static double getMedianAbsoluteDeviation(double[] arr) { 

double[] tempArr = new double[arr.length];
double median = getMedian(arr);
for (int i = 0; i < arr.length; i++) { 

tempArr[i] = Math.abs(arr[i] - median);
}
return getMedian(tempArr);
}
/** * 求标准差 * @param arr * @return */
public static double getStandardDevition(double[] arr) { 

double sum = 0;
double mean = getMean(arr);
for (int i = 0; i < arr.length; i++) { 

sum += Math.sqrt((arr[i] - mean) * (arr[i] - mean));
}
return (sum / (arr.length - 1));
}
}

数据规范化的代码整理:

package cn.javacodes.utils;
import java.util.Arrays;
/** * 数据变化-规范化工具类 * @author 胡湛霏 * @since 2016-09-27 */
public class DataConversionUtils { 

/** * 最小-最大规范化 * * @param arr * @return 规范化后的数组 */
public static double[] minMaxNormalize(double[] arr) { 

// 拷贝数组
double[] tempArr = Arrays.copyOf(arr, arr.length);
// 找到最大值和最小值
double max = tempArr[0], min = tempArr[0];
for (int i = 0; i < tempArr.length; i++) { 

if (tempArr[i] > max) { 

max = tempArr[i];
}
if (tempArr[i] < min) { 

min = tempArr[i];
}
}
// 规范化
for (int i = 0; i < tempArr.length; i++) { 

tempArr[i] = (tempArr[i] - min) / (max - min);
}
return tempArr;
}
/** * Z-score规范化 * @param arr * @return 规范化后的数组 */
public static double[] zScoreNormalize(double[] arr) { 

// 拷贝数组
double[] tempArr = Arrays.copyOf(arr, arr.length);
// 求均值
double sum = 0;
for (double num : tempArr) { 

sum += num;
}
double mean = sum / tempArr.length;
// 求标准差
double sum2 = 0;
for (int i = 0; i < tempArr.length; i++) { 

sum2 += Math.sqrt((tempArr[i] - mean) * (tempArr[i] - mean));
}
double standardDivition = sum2 / (tempArr.length - 1);
// 标准化
for (int i = 0; i < tempArr.length; i++) { 

tempArr[i] = (tempArr[i] - mean) / standardDivition;
}
return tempArr;
}
/** * 小数定标规范化 * @param arr * @return 规范化后的数组 */
public static double[] decimalsNormalize(double[] arr){ 

// 拷贝数组
double[] tempArr = Arrays.copyOf(arr, arr.length);
// 找到最大值
double max = tempArr[0];
for (int i = 0; i < tempArr.length; i++) { 

if (tempArr[i] > max) { 

max = tempArr[i];
}
}
// 确定j的值(j为使max(|v'|)<1的最小整数)
int j = 0;
while (Math.abs(max/Math.pow(10,j))>=1){ 

j++;
}
// 规范化
for (int i = 0; i < tempArr.length; i++) { 

tempArr[i] = tempArr[i] / Math.pow(10,j);
}
return tempArr;
}
}
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/106595.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • 最小二乘法的矩阵推导

    最小二乘法的矩阵推导顾名思义,从数学意义推导最小二乘法公式:一,解释最小二乘法本质是寻找一组x,使Ax与b距离最近。写成二范数的形式为:最合适的x一般出现在函数的极值点,也就是导数为0的点,所以为求导计算方便,我们用二范数的平方作为计算公式:补充知识:(1)二范数二,推导补充知识:设下列向量条件(2)标量对列向量求导证明过程:另一个同理可证。(3)特殊标量对列向量求…

  • 关于opacity属性的探究

    关于opacity属性的探究关于opacity属性的探究上问题!!在前一段时间我朋友和我讨论到了opcaity的属性问题问题如下:代码如下清重点关注opcaity<!–css样式–><style>.boxfather{width:500px;height:500px;background-color:blue;text-align:cen

  • mac idea 2019.1 激活码破解方法

    mac idea 2019.1 激活码破解方法,https://javaforall.cn/100143.html。详细ieda激活码不妨到全栈程序员必看教程网一起来了解一下吧!

  • LoadRunner11下载以及详细激活成功教程说明

    LoadRunner11下载以及详细激活成功教程说明http://blog.csdn.net/oyzl68/article/details/9973143前期准备:LoadRunner11下载请猛戳这里 传送门LoadRunner激活成功教程文件下载请猛戳这里 传送门LoadRunner注册表清理工具下载请猛戳这里 传送门LoadRunner11激活成功教程方法:一、覆盖激活成功教程文件首先请下载LoadRunner激活成功教程文件,

  • 【Minecraft Modding】创建第一个Item

    【Minecraft Modding】创建第一个Item【MinecraftModding】创建第一个Item1.编辑mods.toml文件2.建立目录和包3.编辑Test.java3.注册物品4.定义物品的属性5.runClient在环境创建完成的基础上,就可以开始创建模组了!本文将叙述如何创建一个Item,即Minecraft中的掉落物。1.编辑mods.toml文件首先需要在IntelliJIDEA中载入项目,找到src\main\resources\META-INF\mods.toml文件。该文件包含了这个Mo

  • Maven之(七)pom.xml配置文件详解[通俗易懂]

    Maven之(七)pom.xml配置文件详解[通俗易懂]鉴于CSDN对**版权保护的不作为**以及落后的运营手段,本博客将于近期关闭,并清空全部文章。原有文章将会经过再次的校对、整理,转移至本人在**简书**的[博客空间](https://www.jianshu.com/u/3ec23ef9a408)。…

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号