您的位置：首页 > 编程语言 > Java开发

Java集合框架的知识总结

2012-04-17 08:57 555 查看

说明：先从整体介绍了Java集合框架包含的接口和类，然后总结了集合框架中的一些基本知识和关键点，并结合实例进行简单分析。

1、综述

所有集合类都位于java.util包下。集合中只能保存对象（保存对象的引用变量）。（数组既可以保存基本类型的数据也可以保存对象）。

当我们把一个对象放入集合中后，系统会把所有集合元素都当成Object类的实例进行处理。从JDK1.5以后，这种状态得到了改进：可以使用泛型来限制集合里元素的类型，并让集合记住所有集合元素的类型（参见具体泛型的内容）。

Java的集合类主要由两个接口派生而出：Collection和Map，Collection和Map是Java集合框架的根接口，这两个接口又包含了一些接口或实现类。

Set和List接口是Collection接口派生的两个子接口，Queue是Java提供的队列实现，类似于List。

Map实现类用于保存具有映射关系的数据（key-value）。

Set、List和Map可以看做集合的三大类。

List集合是有序集合，集合中的元素可以重复，访问集合中的元素可以根据元素的索引来访问。

Set集合是无序集合，集合中的元素不可以重复，访问集合中的元素只能根据元素本身来访问（也是不能集合里元素不允许重复的原因）。

Map集合中保存Key-value对形式的元素，访问时只能根据每项元素的key来访问其value。

对于Set、List和Map三种集合，最常用的实现类分别是HashSet、ArrayList和HashMap三个实现类。（并发控制的集合类，以后有空研究下）。

2、Collection接口

Collection接口是List、Set和Queue接口的父接口，同时可以操作这三个接口。

Collection接口定义操作集合元素的具体方法大家可以参考API文档，这里通过一个例子来说明Collection的添加元素、删除元素、返回集合中元素的个数以及清空集合元素的方法。

Java代码

public class TestCollection
{
public static void main(String[] args)

{
Collection c = new ArrayList();
//添加元素

c.add("孙悟空");
//虽然集合里不能放基本类型的值，但Java支持自动装箱

c.add(6);

System.out.println("c集合的元素个数为:" + c.size());

　　　　 //删除指定元素

c.remove(6);

　　　　 System.out.println("c集合的元素个数为:" + c.size());
//判断是否包含指定字符串

System.out.println("c集合的是否包含孙悟空字符串:" + c.contains("孙悟空"));

c.add("轻量级J2EE企业应用实战");

System.out.println("c集合的元素：" + c);

　　　　　Collection books = new HashSet();

books.add("轻量级J2EE企业应用实战");
books.add("Struts2权威指南");

System.out.println("c集合是否完全包含books集合？" + c.containsAll(books));

//用c集合减去books集合里的元素

c.removeAll(books);

System.out.println("c集合的元素：" + c);

//删除c集合里所有元素

c.clear();

System.out.println("c集合的元素：" + c);

//books集合里只剩下c集合里也同时包含的元素

books.retainAll(c);

System.out.println("books集合的元素:" + books);
}
}

public class TestCollection
{
public static void main(String[] args)
{
Collection c = new ArrayList();
//添加元素
c.add("孙悟空");
//虽然集合里不能放基本类型的值，但Java支持自动装箱
c.add(6);

System.out.println("c集合的元素个数为:" + c.size());

　　　　 //删除指定元素
c.remove(6);

　　　　 System.out.println("c集合的元素个数为:" + c.size());
//判断是否包含指定字符串
System.out.println("c集合的是否包含孙悟空字符串:" + c.contains("孙悟空"));

c.add("轻量级J2EE企业应用实战");

System.out.println("c集合的元素：" + c);

　　　　　Collection books = new HashSet();

books.add("轻量级J2EE企业应用实战");
books.add("Struts2权威指南");

System.out.println("c集合是否完全包含books集合？" + c.containsAll(books));

//用c集合减去books集合里的元素
c.removeAll(books);

System.out.println("c集合的元素：" + c);

//删除c集合里所有元素
c.clear();

System.out.println("c集合的元素：" + c);

//books集合里只剩下c集合里也同时包含的元素
books.retainAll(c);

System.out.println("books集合的元素:" + books);
}
}

程序输出结果：

c集合的元素个数为:2

c集合的元素个数为:1

c集合的是否包含孙悟空字符串:true

c集合的元素：[孙悟空, 轻量级J2EE企业应用实战]

c集合是否完全包含books集合？false

c集合的元素：[孙悟空]

c集合的元素：[]

books集合的元素:[]

3、两种遍历集合的方法Iterator接口和foreach循环

1、Iterator接口

Iterator也是Java集合框架的成员，主要用于遍历（即迭代访问）Collection集合中的元素，也称为迭代器。

提供的三种方法：

boolean hasNext():返回集合里的下一个元素。

Object next():返回集合里下一个元素。

void remove();删除集合里上一次next方法返回的元素。

Java代码

public class TestIterator
{
public static void main(String[] args)

{
//创建一个集合

Collection books = new HashSet();

books.add("轻量级J2EE企业应用实战");
books.add("Struts2权威指南");
books.add("基于J2EE的Ajax宝典");

//获取books集合对应的迭代器

Iterator it = books.iterator();

while(it.hasNext())
{
　　　　　　　//未使用泛型，需要强制转换

String book = (String)it.next();

System.out.println(book);

if (book.equals("Struts2权威指南"))
{
it.remove();

　　　　//使用Iterator迭代过程中，不可修改集合元素,下面代码引发异常

　　　　//books.remove(book);

}

//对book变量赋值，不会改变集合元素本身

book = "测试字符串";

}
System.out.println(books);
}
}

public class TestIterator
{
public static void main(String[] args)
{
//创建一个集合
Collection books = new HashSet();

books.add("轻量级J2EE企业应用实战");
books.add("Struts2权威指南");
books.add("基于J2EE的Ajax宝典");

//获取books集合对应的迭代器
Iterator it = books.iterator();

while(it.hasNext())
{
　　　　　　　//未使用泛型，需要强制转换
String book = (String)it.next();

System.out.println(book);

if (book.equals("Struts2权威指南"))
{
it.remove();

　　　　//使用Iterator迭代过程中，不可修改集合元素,下面代码引发异常
　　　　//books.remove(book);

}

//对book变量赋值，不会改变集合元素本身
book = "测试字符串";

}
System.out.println(books);
}
}

程序运行结果：

Struts2权威指南

基于J2EE的Ajax宝典

轻量级J2EE企业应用实战

[基于J2EE的Ajax宝典, 轻量级J2EE企业应用实战]

说明：

（1）通过语句“book
= "测试字符串"; ”对迭代变量book进行赋值时，当我们再次输出books集合时，集合里的元素没有任何变化。即当使用Iterator对集合元素进行迭代时，Iterator并不是把集合元素本身传给迭代变量，而是把集合元素的值传给了迭代变量。

（2）当使用Iterator来访问Collection集合元素时，只有通过Iterator的remove方法删除（it.remove();）上一次next方法返回的集合元素才可以给集合中添加元素（book = "测试字符串"; ）。否则引发java.util.ConcurrentModificationExcption异常。

2、使用foreach循环遍历集合元素。

格式：for(元素类型 t 元素变量 x ：遍历对象A) {

// 程序块

}

说明：

（1）foreach简化了对数组和集合的遍历，如果不希望遍历整个集合，或者在循环内部需要操作下标值就需要使用传统的for循环。

（2）简化了编程，提高了代码的可读性和安全性（不用怕数组越界）。

（3）foreach一般结合泛型使用

实例应用：

Java代码

public class TestArray {
public static void main(String args[]) {

TestArray test = new TestArray();
test.test1();
test.listToArray();
test.testArray3();

}

/**

* foreach语句输出一维数组

*/
public void test1() {
// 定义并初始化一个数组

int arr[] = { 2, 3, 1 };

System.out.println("----1----排序前的一维数组");

for (int x : arr) {
System.out.println(x); // 逐个输出数组元素的值

}

// 对数组排序

Arrays.sort(arr);

// 利用java新特性for each循环输出数组

System.out.println("----1----排序后的一维数组");

for (int x : arr) {
System.out.println(x); // 逐个输出数组元素的值

}
}

/**

* 集合转换为一维数组

*/
public void listToArray() {
// 创建List并添加元素

List<String> list = new ArrayList<String>();
list.add("1");
list.add("3");
list.add("4");

// 利用froeach语句输出集合元素

System.out.println("----2----froeach语句输出集合元素");

for (String x : list) {
System.out.println(x);
}

// 将ArrayList转换为数组

Object s[] = list.toArray();

// 利用froeach语句输出集合元素

System.out.println("----2----froeach语句输出集合转换而来的数组元素");

for (Object x : s) {
System.out.println(x.toString()); // 逐个输出数组元素的值

}
}

/**

* foreach输出二维数组测试

*/
public void testArray2() {
int arr2[][] = { { 4, 3 }, { 1, 2 } };

System.out.println("----3----foreach输出二维数组测试");

for (int x[] : arr2) {
for (int e : x) {
System.out.println(e); // 逐个输出数组元素的值

}
}
}

/**

* foreach输出三维数组

*/
public void testArray3() {
int arr[][][] = { { { 1, 2 }, { 3, 4 } }, { { 5, 6 }, { 7, 8 } } };

System.out.println("----4----foreach输出三维数组测试");

for (int[][] a2 : arr) {
for (int[] a1 : a2) {
for (int x : a1) {
System.out.println(x);
}
}
}
}
}

public class TestArray {
public static void main(String args[]) {
TestArray test = new TestArray();
test.test1();
test.listToArray();
test.testArray3();

}

/**
* foreach语句输出一维数组
*/
public void test1() {
// 定义并初始化一个数组
int arr[] = { 2, 3, 1 };
System.out.println("----1----排序前的一维数组");

for (int x : arr) {
System.out.println(x); // 逐个输出数组元素的值
}

// 对数组排序
Arrays.sort(arr);

// 利用java新特性for each循环输出数组
System.out.println("----1----排序后的一维数组");

for (int x : arr) {
System.out.println(x); // 逐个输出数组元素的值
}
}

/**
* 集合转换为一维数组
*/
public void listToArray() {
// 创建List并添加元素
List<String> list = new ArrayList<String>();
list.add("1");
list.add("3");
list.add("4");

// 利用froeach语句输出集合元素
System.out.println("----2----froeach语句输出集合元素");

for (String x : list) {
System.out.println(x);
}

// 将ArrayList转换为数组
Object s[] = list.toArray();

// 利用froeach语句输出集合元素
System.out.println("----2----froeach语句输出集合转换而来的数组元素");

for (Object x : s) {
System.out.println(x.toString()); // 逐个输出数组元素的值
}
}

/**
* foreach输出二维数组测试
*/
public void testArray2() {
int arr2[][] = { { 4, 3 }, { 1, 2 } };

System.out.println("----3----foreach输出二维数组测试");

for (int x[] : arr2) {
for (int e : x) {
System.out.println(e); // 逐个输出数组元素的值
}
}
}

/**
* foreach输出三维数组
*/
public void testArray3() {
int arr[][][] = { { { 1, 2 }, { 3, 4 } }, { { 5, 6 }, { 7, 8 } } };

System.out.println("----4----foreach输出三维数组测试");

for (int[][] a2 : arr) {
for (int[] a1 : a2) {
for (int x : a1) {
System.out.println(x);
}
}
}
}
}

程序运行结果：

----1----排序前的一维数组

2

3

1

----1----排序后的一维数组

1

2

3

----2----froeach语句输出集合元素

1

3

4

----2----froeach语句输出集合转换而来的数组元素

1

3

4

----4----foreach输出三维数组测试

1

2

3

4

5

6

7

8

感想：

这篇先写到这里，后续文章将会介绍其余集合接口和类的详细知识。

这是自己写博客的第一篇文章，虽然很多内容都是借鉴高手的，但是从他们的字里行间可以看出他们对技术的痴迷和研究的深入。

我从接触Java到现在也就一年多时间，我深深被Java的一些程序表达方式所吸引。感觉它的语言风格更接近我们自然语言的表述。

在程序中表达自己的思想何尝不是一件畅事。

虽然断断续续的自学了一些Java知识，现在也可以看懂Java的大部分代码，但是要是自己去写出那些高深的代码，感觉还是有些棘手。

听大师说，语言是用来思考的。

要是学会了用Java语言进行思考，那么一定可以小有所成。

现在给自己制定了一个计划，就是从写博客来提高自己学习Java的积极性。

首先是一些基础知识的总结，结合一些实例表明知识的应用。

我想这会持续很久，也是考验自己，提高自己的好机会。

正如我的博客标题，用代码阐释人生的哲学，从代码中领悟人生，看清世事。

祝福每个奋斗在Java中的人们都可以找到最真的自己。

文章中代码和部分内容来源于《疯狂Java讲义》，如需转载，请注明出处。谢谢。

1、Set接口的使用

Set集合里多个对象之间没有明显的顺序。具体详细方法请参考API文档（可见身边随时带上API文档有多重要），基本与Collection方法相同。只是行为不同（Set不允许包含重复元素）。

Set集合不允许重复元素，是因为Set判断两个对象相同不是使用==运算符，而是根据equals方法。即两个对象用equals方法比较返回true，Set就不能接受两个对象。

Java代码

public class TestSet
{
public static void main(String[] args)

{
Set<String> books = new HashSet<String>();

//添加一个字符串对象

books.add(new String("Struts2权威指南"));

//再次添加一个字符串对象，

//因为两个字符串对象通过equals方法比较相等，所以添加失败，返回false

boolean result = books.add(new String("Struts2权威指南"));

System.out.println(result);

//下面输出看到集合只有一个元素

System.out.println(books);
}
}

public class TestSet
{
public static void main(String[] args)
{
Set<String> books = new HashSet<String>();

//添加一个字符串对象
books.add(new String("Struts2权威指南"));

//再次添加一个字符串对象，
//因为两个字符串对象通过equals方法比较相等，所以添加失败，返回false
boolean result = books.add(new String("Struts2权威指南"));

System.out.println(result);

//下面输出看到集合只有一个元素
System.out.println(books);
}
}

程序运行结果：

false

[Struts2权威指南]

说明：程序中，book集合两次添加的字符串对象明显不是一个对象（程序通过new关键字来创建字符串对象），当使用==运算符判断返回false，使用equals方法比较返回true，所以不能添加到Set集合中，最后只能输出一个元素。

Set接口中的知识，同时也适用于HashSet、TreeSet和EnumSet三个实现类。

2、HashSet类

HashSet按Hash算法来存储集合的元素，因此具有很好的存取和查找性能。

HashSet的特点：

（1）HashSet不是同步的，多个线程访问是需要通过代码保证同步

（2）集合元素值可以使null。

HashSet集合判断两个元素相等的标准是两个对象通过equals方法比较相等，并且两个对象的hashCode（）方法返回值也相等。

//类A的equals方法总是返回true,但没有重写其hashCode()方法

Java代码

class A
{
public boolean equals(Object obj)
{
return true;
}
}
//类B的hashCode()方法总是返回1,但没有重写其equals()方法

class B
{
public int hashCode()
{
return 1;
}
}
//类C的hashCode()方法总是返回2,但没有重写其equals()方法

class C
{
public int hashCode()
{
return 2;
}
public boolean equals(Object obj)
{
return true;
}
}
public class TestHashSet
{
public static void main(String[] args)

{
HashSet<Object> books = new HashSet<Object>();
//分别向books集合中添加2个A对象，2个B对象，2个C对象

books.add(new A());
books.add(new A());
books.add(new B());
books.add(new B());
books.add(new C());
books.add(new C());
System.out.println(books);
}
}

class A
{
public boolean equals(Object obj)
{
return true;
}
}
//类B的hashCode()方法总是返回1,但没有重写其equals()方法
class B
{
public int hashCode()
{
return 1;
}
}
//类C的hashCode()方法总是返回2,但没有重写其equals()方法
class C
{
public int hashCode()
{
return 2;
}
public boolean equals(Object obj)
{
return true;
}
}
public class TestHashSet
{
public static void main(String[] args)
{
HashSet<Object> books = new HashSet<Object>();
//分别向books集合中添加2个A对象，2个B对象，2个C对象
books.add(new A());
books.add(new A());
books.add(new B());
books.add(new B());
books.add(new C());
books.add(new C());
System.out.println(books);
}
}

程序运行结果：
[B@1, B@1, C@2, A@b5dac4, A@9945ce]

说明：

（1）Object类提供的toString方法总是返回该对象实现类的类名+@+hashCode(16进制数）值，所以可以看到上面程序输出的结果。可以通过重写toString方法来输出自己希望的形式。

（2）即使2个A对象通过equals比较返回true，但HashSet依然把它们当成2个对象；即使2个B对象的hashCode（）返回相同值，但HashSet依然把它们当成2个对象。即如果把一个对象放入HashSet中时，如果重写该对象equals（）方法，也应该重写其hashCode（）方法。其规则是：如果2个对象通过equals方法比较返回true时，这两个对象的hashCode也应该相同。

hash算法的功能：

它能保证通过一个对象快速查找到另一个对象。hash算法的价值在于速度，它可以保证查询得到快速执行。

当需要查询集合中某个元素时，hash算法可以直接根据该元素的值得到该元素保存位置，从而可以让程序快速找到该元素。

当从HashSet中访问元素时，HashSet先计算该元素的hashCode值（也就是调用该对象的hashCode（））方法的返回值），然后直接到该hashCode对应的位置去取出该元素。

即也是快速的原因。HashSet中每个能存储元素的“曹位（slot）”通常称为“桶（bucket）”，如果多个元素的hashCode相同，但它们通过equals（）方法比较返回false，就需要一个“桶”里放多个元素，从而导致性能下降。

继续深入研究HashSet：

当向HashSet中添加一个可变对象后，并且后面程序修改了该可变对象的属性，可能导致它与集合中其他元素相同，这就可能导致HashSet中包含两个相同的对象。

看下面程序：

Java代码

<SPAN>class R</SPAN>{
int count;
public R(int count)
{
this.count = count;
}
public String toString()
{
return "R(count属性:" + count + ")";

}
public boolean equals(Object obj)
{
if (obj instanceof R)
{
R r = (R)obj;
if (r.count == this.count)
{
return true;
}
}
return false;
}
public int hashCode()
{
return this.count;
}
}
public class TestHashSet2
{
public static void main(String[] args)

{
HashSet<R> hs = new HashSet<R>();
hs.add(new R(5));
hs.add(new R(-3));
hs.add(new R(9));
hs.add(new R(-2));
//打印TreeSet集合，集合元素是有序排列的

System.out.println(hs);
//取出第一个元素

Iterator<R> it = hs.iterator();
R first = (R)it.next(); //first指向集合的第一个元素

//为第一个元素的count属性赋值

first.count = -3; //first指向的元素值发生改变，地址并没有改变，大家可以试着用Java内存分配机制（栈和堆)思考下。

//再次输出count将看到HashSet里的元素处于无序状态

System.out.println(hs);
hs.remove(new R(-3));
System.out.println(hs);
//输出false

System.out.println("hs是否包含count为-3的R对象？" + hs.contains(new R(-3)));

//输出false

System.out.println("hs是否包含count为5的R对象？" + hs.contains(new R(5)));

}
}

class R{
int count;
public R(int count)
{
this.count = count;
}
public String toString()
{
return "R(count属性:" + count + ")";
}
public boolean equals(Object obj)
{
if (obj instanceof R)
{
R r = (R)obj;
if (r.count == this.count)
{
return true;
}
}
return false;
}
public int hashCode()
{
return this.count;
}
}
public class TestHashSet2
{
public static void main(String[] args)
{
HashSet<R> hs = new HashSet<R>();
hs.add(new R(5));
hs.add(new R(-3));
hs.add(new R(9));
hs.add(new R(-2));
//打印TreeSet集合，集合元素是有序排列的
System.out.println(hs);
//取出第一个元素
Iterator<R> it = hs.iterator();
R first = (R)it.next();     //first指向集合的第一个元素
//为第一个元素的count属性赋值
first.count = -3;           //first指向的元素值发生改变，地址并没有改变，大家可以试着用Java内存分配机制（栈和堆)思考下。
//再次输出count将看到HashSet里的元素处于无序状态
System.out.println(hs);
hs.remove(new R(-3));
System.out.println(hs);
//输出false
System.out.println("hs是否包含count为-3的R对象？" + hs.contains(new R(-3)));
//输出false
System.out.println("hs是否包含count为5的R对象？" + hs.contains(new R(5)));

}
}

程序运行结果：

[R(count属性:5), R(count属性:9), R(count属性:-3), R(count属性:-2)]

[R(count属性:-3), R(count属性:9), R(count属性:-3), R(count属性:-2)]

[R(count属性:-3), R(count属性:9), R(count属性:-2)]

hs是否包含count为-3的R对象？false

hs是否包含count为5的R对象？false

说明：程序重写了R类的equals（）和hashCode（）方法，这两个方法都是根据R对象的count属性来判断。从运行结果可以看出，HashSet集合中有完全相同元素，这表明两个元素已经重复，但因为HashSet在添加它们时已经把它们添加到了不同地方，所以HashSet完全可以容纳两个相同元素。至于第一个count为-3的R对象，它保存在count为5的R对象对应的位置（地址）。当向HashSet中添加可变对象时，必须十分小心。如果修改HashSet集合中的对象，有可能导致该对象与集合中其他对象相等，从而导致HashSet无法准确访问该对象。

HashSet还有一个子类LinkedHashSet，LinkedHashSet集合也根据元素hashCode值来决定元素存储位置，但它同时使用链表维护元素的次序，即当遍历LinkedHashSet集合元素时，HashSet将会按元素的添加顺序来访问集合里的元素。

3、TreeSet类

TreeSet是SortedSet接口的唯一实现，TreeSet可以确保集合元素处于排序状态（元素是有序的）。

TreeSet提供的几个额外方法：

Comparator comparator()：返回当前Set使用的Comparator，或者返回null，表示以自然方式排序。

Object first()：返回集合中的第一个元素。

Object last()：返回集合中的最后一个元素。

Objiect lower(Object e)：返回集合中位于指定元素之前的元素（即小于指定元素的最大元素，参考元素可以不是TreeSet的元素）。

Object higher(Object e)：返回集合中位于指定元素之后的元素（即大于指定元素的最小元素，参考元素可以不需要TreeSet的元素）。

SortedSet subSet(fromElement， toElement)：返回此Set的子集，范围从fromElement(包含大于等于）到toElement(不包含小于）。

SortedSet headSet(toElement)：返回此Set的子集，由小于toElement的元素组成。

SortedSet tailSet(fromElement)：返回此Set的子集，由大于或等于fromElement的元素组成。

public class TestTreeSetCommon

Java代码

{
public static void main(String[] args)

{
TreeSet<Integer> nums = new TreeSet<Integer>();
//向TreeSet中添加四个Integer对象

nums.add(5);
nums.add(2);
nums.add(10);
nums.add(-9);
//输出集合元素，看到集合元素已经处于排序状态

System.out.println(nums);
//输出集合里的第一个元素

System.out.println(nums.first());
//输出集合里的最后一个元素

System.out.println(nums.last());
//返回小于4的子集，不包含4

System.out.println(nums.headSet(4));
//返回大于5的子集，如果Set中包含5，子集中还包含5

System.out.println(nums.tailSet(5));
//返回大于等于-3，小于4的子集。

System.out.println(nums.subSet(-3 , 4));
}
}

{
public static void main(String[] args)
{
TreeSet<Integer> nums = new TreeSet<Integer>();
//向TreeSet中添加四个Integer对象
nums.add(5);
nums.add(2);
nums.add(10);
nums.add(-9);
//输出集合元素，看到集合元素已经处于排序状态
System.out.println(nums);
//输出集合里的第一个元素
System.out.println(nums.first());
//输出集合里的最后一个元素
System.out.println(nums.last());
//返回小于4的子集，不包含4
System.out.println(nums.headSet(4));
//返回大于5的子集，如果Set中包含5，子集中还包含5
System.out.println(nums.tailSet(5));
//返回大于等于-3，小于4的子集。
System.out.println(nums.subSet(-3 , 4));
}
}

程序运行结果：

[-9, 2, 5, 10]

-9

10

[-9, 2]

[5, 10]

[2]

说明：由运行结果可以看出，TreeSet并不是根据元素的插入顺序进行排序，而是根据元素实际值来进行排序。TreeSet采用红黑树的数据结构对元素进行排序，具体排序内容会在后续文章中说明。

内容来自用户分享和网络整理，不保证内容的准确性，如有侵权内容，可联系管理员处理

标签：

相关文章推荐

新的分享

章节导航