内存泄漏与内存溢出

不管哪种编程语言的内存分配方式，都需要返回所分配内存的真实地址，也就是返回一个指针到内存块的首地址。java中对象可以采用new或反射或clone或反序列化的方法创建，这些对象的创建都是在堆（Heap）中分配的，所有对象的回收都是由java虚拟机通过垃圾回收机制完成的。GC为了能够正确释放对象，会监控每个对象的运行状况，对他们的申请、引用、被引用、赋值等状况进行监控，java会使用有向图的方法来管理内存，实时监控对象是否可以达到，如果不可到达，则就将其回收，这样也可以消除引用循环的问题。

java使用有向图的方式进行内存管理，示例如下：

在有向图中，我们叫做obj1是可达的，obj2就是不可达的，显然不可达的可以被清理。

释放对象的根本原则就是对象不会再被使用。在java语言中，判断一个内存空间是否符合垃圾收集标准有两个：

给对象赋予了空值null，之后再没有调用过；
另一个是给对象赋予了新值，这样重新分配了内存空间。

接下来介绍内存泄漏与内存溢出：

内存泄漏（memory leak）：是指无用对象（不再使用的对象）持续占有内存或无用对象的内存得不到及时释放，从而造成的内存空间的浪费称为内存泄漏。
内存溢出（out of memory）：指程序运行过程中无法申请到足够的内存而导致的一种错误。即程序在申请内存时，没有足够的内存空间供其使用。

内存泄漏是内存溢出的一种诱因，不是唯一因素，那么，java内存泄漏根本原因是什么？长生命周期的对象持有短生命周期对象的引用，就很可能发生内存泄漏。尽管短生命周期对象已经不再需要，但是因为长生命周期对象持有它的引用而导致不能被回收，这就是java中内存泄漏的发生场景。

memory leak会最终导致out of memory，内存溢出就是你要求分配的内存超出了系统能给你的，系统不能满足需求，于是产生溢出。

在java中出现内存泄漏的场景，主要有如下几个大类：

(1)静态集合类引起内存泄漏

如HashMap、Vector等的使用最容易出险内存泄漏，这些静态变量的生命周期和应用程序一致，他们所引用的所有的对象Object也不能被释放，因为他们也将一直被Vector等引用着。

Static Vector v = new Vector(10);
for (int i = 1; i<100; i++)
{
     Object o = new Object();
     v.add(o);
     o = null;
}

在这个例子中，循环申请Object对象，并将所申请的对象放入一个Vector中，如果仅仅释放引用本身（o=null），那么Vector仍然引用该对象，所以这个对象对GC来说是不可回收。因此，如果对象加入到Vector后，还必须从Vector中删除，最简单的方法就是将Vector对象设置为null。

（2）当集合里面的对象属性被修改后，再调用remove()方法时不起作用

Set<Person> set = new HashSet<Person>();
Person p1 = new Person("唐僧","pwd1",25);
Person p2 = new Person("孙悟空","pwd2",26);
Person p3 = new Person("猪八戒","pwd3",27);
set.add(p1);
set.add(p2);
set.add(p3);
System.out.println("总共有:"+set.size()+" 个元素!"); //结果：总共有:3 个元素!
p3.setAge(2); //修改p3的年龄,此时p3元素对应的hashcode值发生改变
	 
//切记不要在修改这个对象后使用remove(Object o)，这也可能会发生内存泄露
set.remove(p3); //此时remove不掉，造成内存泄漏
	 
set.add(p3); //重新添加，居然添加成功

for (Person person : set)
{
    System.out.println(person.getAge());
}

就Set而言，remove()方法是通过equals()方法来删除匹配的元素的，如果一个对象确实提供了正确的equals()方法，但是切忌不要在修改这个对象后使用remove(),这可能会发生内存泄漏。

（3）数据库连接

比如数据库连接（dataSource.getConnection()）、网络连接（socket）和io连接，以及使用其它框架的时候，除非显示的调用了其close()方法（或类似方法）将其连接关闭，否则是不会自动被GC回收的。其实原因就是长生命周期对象持有短生命周期对象的引用。

对于Resultset和Statement对象可以不进行显示回收，但Connection一定要显示回收，因为Connection在任何时候都无法自动回收，而Connection一旦回收，Resultset和Statement对象就会立即为null。

但是如果使用连接池，情况就不一样了，除了要显式地关闭连接，还必须显式地关闭Resultset Statement 对象（关闭其中一个，另外一个也会关闭），否则就会造成大量的Statement 对象无法释放，从而引起内存泄漏。这种情况下一般都会在try里面去的连接，在finally里面释放连接。

（4）内部类和外部模块等的引用

内部类的引用是比较容易遗忘的一种，而且一旦没释放，可能导致一系列的后继承类对象没有释放。此外还要小心外部模块不经意的引用。

（5）单例模式

不正确使用单例模式是引起内存泄漏的一个常见问题，单例对象在被初始化后将在JVM的整个生命周期中存在（以静态变量的方式），如果单例对象持有外部对象的引用，那么这个外部对象将不能被JVM正常回收，导致内存泄漏。

单例模式很多时候我们可以把它的生命周期与整个程序的生命周期看做差不多的，所以是一个长生命周期的对象。如果这个对象持有其他对象的引用，也很容易发生内存泄漏。

如果以发生泄漏的方式来分类，内存泄漏可以分为4类：

常发性内存泄漏。发生内存泄漏的代码会被多次执行，每次被执行的时候都会导致一块内存泄漏。
偶发性内存泄漏。发生内存泄漏的代码只有在某些特定环境或操作过程下才会发生。常发性和偶发性是相对的，对于特定的环境，偶发性的也许就变成了常发性的。所以测试环境和测试方法对检测内存泄漏至关重要。
一次性内存泄漏。发生内存泄漏的代码只会被执行一次，或者由于算法上的缺陷，导致总有一块仅且一块内存发生泄漏。比如，在类的构造函数中分配内存，在析构函数中却没有释放内存，所以内存泄漏只会发生一次。
隐式内存泄漏。程序在运行过程中不听的分配内存，但是直到结束的时候才释放内存。严格的说这里并没有发生内存泄漏，因为最终程序释放了所有申请的内存。但是对于一个服务器程序，需要运行几天、几周甚至几个月，不及时释放内存也可能导致最终耗尽系统的所有内存。所以，我们称这类内存泄漏为隐式内存泄漏。