java性能优化技巧二

1. 谨慎对待Java的循环遍历Java中的列表遍历可比它看起来要麻烦多了。就以下面两段代码为例:A:1234private final List _bars;for(Bar bar : _bars) {    //Do important stuff}B:12345private final List _bars;for(int i = 0; i _bars.size(); i++) {Bar

大家好,又见面了,我是全栈君。

之前整理过一篇java性能优化的博客,链接
java性能优化一,今天补充几个

1. 谨慎对待Java的循环遍历
Java中的列表遍历可比它看起来要麻烦多了。就以下面两段代码为例:
A:
  • private final List<Bar> _bars;
    for(Bar bar : _bars) {
        //Do important stuff
    }
  • B:
  • private final List<Bar> _bars;
    for(int i = 0; i < _bars.size(); i++) {
    	Bar bar = _bars.get(i);
    	//Do important stuff
    }
  • 代码A执行的时候 会为这个抽象列表创建一个迭代器,而代码B就直接使用 get(i) 来获取元素,相对于代码A省去了迭代器的开销。
  • 实际上这里还是需要一些权衡的。代码A使用了迭代器,保证了在获取元素的时候的时间复杂度是 O(1) (使用了 getNext() 和 hasNext() 方法),最终的时间复杂度为 O(n) 。但是对于代码B,循环里每次在调用 _bars.get(i) 的时候花费的时间复杂度为 O(n)  (假设这个list为一个 LinkedList),那么最终代码B整个循环的时间复杂度就是 O(n^2)  (但如果代码B里面的list是 ArrayList, 那 get(i) 方法的时间复杂度就是 O(1)了)。所以在决定使用哪一种遍历的方式的时候,我们需要考虑列表的底层实现,列表的平均长度以及所使用的内存。如果我们需要优化内存,再加上 ArrayList 在大多数情况下查找的时间复杂度为 O(1) ,可以选择代码B所使用的方法。

  • 2.在初始化的时候预估集合的大小

从Java的这篇 文档我们可以了解到: “一个HashMap 实例有两个影响它性能的因素:初始大小和加载因子(load factor)。 当哈希表的大小达到初始大小和加载因子的乘积的时候,哈希表会进行 rehash操作。如果在一个HashMap 实例里面要存储多个映射关系时,我们需要设置足够大的初始化大小以便更有效地存储映射关系而不是让哈希表自动增长让后rehash,造成性能瓶颈。”


常常碰到需要遍历一个 
ArrayList 并将这些元素保存到 
HashMap 里面去,将这个 
HashMap 初始化预期的大小可以避免再次哈希所带来的开销。初始化大小可以设置为输入的数组大小除以默认加载因子的结果值(这里取0.7):
  • 优化前的代码:
  • HashMap<String,Foo> _map;
    void addObjects(List<Foo> input)
    {
      _map = new HashMap<String, Foo>();
      for(Foo f: input)
      {
        _map.put(f.getId(), f);
      }
    }

    优化后的代码

  • HashMap<String,Foo> _map;void addObjects(List<Foo> input){	_map = new HashMap<String, Foo>((int)Math.ceil(input.size() / 0.7));	for(Foo f: input)	{		_map.put(f.getId(), f);	}}

  • 3. 延迟表达式的计算

在Java中,所有的方法参数会在方法调用之前,只要有方法参数是一个表达式的都会先对这个表达式进行计算(从左到右)。这个规则会导致一些不必要的操作。考虑到下面一个场景:使用ComparisonChain比较两个 Foo 对象。使用这样的比较链条的一个好处就是在比较的过程中只要一个 compareTo 方法返回了一个非零值整个比较就结束了,避免了许多无谓的比较。例如现在这个场景中的要比较的对象最先考虑他们的score, 然后是 position, 最后就是 _bar 这个属性了:

public class Foo {	private float _score;	private int _position;	private Bar _bar; 	public int compareTo (Foo other) {		return ComparisonChain.start().			compare(_score, other.getScore()).			compare(_position, other.getPosition()).			compare(_bar.toString(), other.getBar().toString()).			result;	}}

但是上面这种实现方式总是会先生成两个 String 对象来保存 bar.toString() 和other.getBar().toString() 的值,即使这两个字符串的比较可能不需要。避免这样的开销,可以为Bar 对象实现一个 comparator:

public class Foo {
	private float _score;
	private int _position;
	private Bar _bar;
	private final BarComparator BAR_COMPARATOR = new BarComparator();
 
	public int compareTo (Foo other) {
		return ComparisonChain.start().
			compare(_score, other.getScore()).
			compare(_position, other.getPosition()).
			compare(_bar, other.getBar(), BAR_COMPARATOR).
			result();
	}
	private static class BarComparator implements Comparator<Bar> {
		@Override
		public int compare(Bar a, Bar b) {
			return a.toString().compareTo(b.toString());
		}
	}
}

4. 提前编译正则表达式

字符串的操作在Java中算是开销比较大的操作。还好Java提供了一些工具让正则表达式尽可能地高效。动态的正则表达式在实践中比较少见。在接下来要举的例子中,每次调用 String.replaceAll() 都包含了一个常量模式应用到输入值中去。因此我们预先编译这个模式可以节省CPU和内存的开销。

优化前:

  • private String transform(String term) {
    	return outputTerm = term.replaceAll(_regex, _replacement);
    }
  • 优化后:
  • private final Pattern _pattern = Pattern.compile(_regex);
    private String transform(String term) {
    	return outputTerm = _pattern.matcher(term).replaceAll(_replacement);
    }

5. 尽可能地缓存Cache it if you can

将结果保存在缓存里也是一个避免过多开销的方法。现在已经有多种LRU(Least Recently Used )缓存算法实现。 


6. String的intern方法有用,但是也有危险

String 的 intern 特性有时候可以代替缓存来使用。

从这篇文档,我们可以知道:

“A pool of strings, initially empty, is maintained privately by the class String. When the intern method is invoked, if the pool already contains a string equal to this String object as determined by the equals(Object) method, then the string from the pool is returned. Otherwise, this String object is added to the pool and a reference to this String object is returned”.

这个特性跟缓存很类似,但有一个限制,你不能设置最多可容纳的元素数目。因此,如果这些intern的字符串没有限制(比如字符串代表着一些唯一的id),那么它会让内存占用飞速增长。

作者:jason0539

博客:http://blog.csdn.net/jason0539(转载请说明出处)

扫码关注我微信公众号

java性能优化技巧二

版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌侵权/违法违规的内容, 请发送邮件至 举报,一经查实,本站将立刻删除。

发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/121328.html原文链接:https://javaforall.cn

【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛

【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...

(0)


相关推荐

  • webpack(5)webpack处理css文件[通俗易懂]

    webpack(5)webpack处理css文件[通俗易懂]css文件处理-准备工作(以下项目配置都是基于上一篇webpack(4)的基础上)在项目开发中,我们必然需要添加很多的样式,而样式我们往往写到一个单独的文件中。这里我们就在src目录中创建一个n

  • 关于libsvm的PCA和 网格寻优「建议收藏」

    关于libsvm的PCA和 网格寻优「建议收藏」这篇博客写的很乱,只是先大致记录一下,后期行得通再慢慢补充。之前稍微整理了libsvm的内容,但是还有很多没搞懂,最近因为论文思路卡住了,所以又反过来弄libsvm因为看人家的论文,偏应用的方面,流程都非常完整,特征提取以后,一般有降维,有参数寻优,所以就很想实现这些功能,因为对比实验真的一点也写不下去了,头大…而且svm的工具箱非常的成熟了,除了常用的libsvm工具包,还有Libsvm-FarutoUltimate的工具包,这是一个基于libsvm的工具箱,增加了许多实用的功能:降维、参数寻优、可

  • poi系列(二):通过poi、poi-ooxml读取写出excel

    poi系列(二):通过poi、poi-ooxml读取写出excel(根据网上多篇文档实践整理加工,非原创也非转载)本类主要是读取后缀为xlsx或xls的excel操作。需要导入包&lt;dependency&gt;&lt;groupId&gt;org.apache.poi&lt;/groupId&gt;&lt;artifactId&gt;poi&lt;/artifactId&gt;…

  • connectionstring

    connectionstring在ASP.NET开发的网站根目录,有一个名为web.config的文件,顾名思义,这是为整个网站进行配置的文件,其格式为XML格式。这里主要谈谈文件中的节。节是对连接到数据库的字符串进行配置,由于M

  • 10道线程池面试题

    10道线程池面试题面试题1:ThreadPoolExecutor有哪些常用的方法?ThreadPoolExecutor有如下常用方法:submit()/execute():执行线程池shutdown()/shutdownNow():终止线程池isShutdown():判断线程是否终止getActiveCount():正在运行的线程数getCorePoolSize():获取核心线程数getMaximumPoolSize():获取最大线程数getQueue():获取线程池中的任务队列allowCoreThr

  • 如何证明哈夫曼树是最优二叉树_哈夫曼树完全二叉树

    如何证明哈夫曼树是最优二叉树_哈夫曼树完全二叉树一、定义一些定义:节点之间的路径长度:在树中从一个结点到另一个结点所经历的分支,构成了这两个结点间的路径上的经过的分支数称为它的路径长度树的路径长度:从树的根节点到树中每一结点的路径长度之和。在结点数目相同的二叉树中,完全二叉树的路径长度最短。结点的权:在一些应用中,赋予树中结点的一个有某种意义的实数。结点的带权路径长度:结点到树根之间的路径长度与该结点上权的乘积。树的带权路径长度(Weighte…

    2022年10月28日

发表回复

您的电子邮箱地址不会被公开。

关注全栈程序员社区公众号