您好,欢迎访问一九零五行业门户网

Java 泛型(Generics) 综述示例代码详解

一. 引子一般的类和方法,只能使用具体类型:要么是基本类型,要么是自定义类型。如果要编写可以应用于多种类型的代码,这种刻板的限制对代码的束缚就会很大。
多态算是一种泛化机制,但对代码的约束还是太强(要么继承父类,要么实现接口)。
有许多原因促成了泛型的出现,而最引人注目的一个原因,就是为了创造容器类。(泛型的主要目的之一就是用来指定容器要持有什么类型的对象,而且由编译器来保证类型的正确性)
例如,在 java 实现加入泛型前,arraylist 只维护一个 object 类型的数组:
public class arraylist{ private object[] elementdata; ... public object get(int i){ ... } public void add(object o){ ... } ... }
显然,这样的实现存在两个问题:
当获取一个值时,必须进行强制类型转换:
arraylist list = new arraylist(); ... string str = (string)list.get(0);
该 arraylist 没有错误检查,即可以向数组中添加任何类型的对象:
list.add(new integer(1));
向上述的动态数组中添加一个整形对象,程序在编译时和运行时都不会出错。但当我们强制将 get 结果转型时,就会抛出 classcastexception 异常,程序将会出错。
对于我们的容器类,它是可以存储任何对象的,但我们在使用时,一次只想也只应该向其中放入一种对象。基于这种需求,提出了类型参数化的概念,即泛型。 
二. 泛型基础1.概念
“泛型”术语:适用于许多许多的类型
“泛型”本质:实现的类型参数化的概念,使代码可以应用于多种类型
“泛型”核心:告诉编译器想使用什么类型(指定具体类型参数或对其进行限制),然后编译器帮你处理一切细节(类型安全检查等)
“泛型”初衷:
(1). 希望类或方法具备最广泛的表达能力,即通过解耦类或方法与所使用的类型之间的约束;
(2). 对容器类而言,泛型在保证容器类可以存储任何类型对象的同时,又保证了容器类一旦声明自己将要保存的元素类型时,就不可再保存其他类型了,例如:
arraylist<fruit> list = new arraylist<fruit>(); fruits.add(new fruit()); // okfruits.add(new apple()); // okfruits.add(new orange()); // okfruits.add(new object()); // error
上述代码表明了该容器只能保存 fruit类型 的对象,由于 apple 也是一种 fruit,所以其也可以保存 apple类型对象,但对于不属于 fruit类型 的对象,编译器杜绝将其放入列表中。
简单地说:泛型 = 编译时的类型检查 + 编译时的类型擦除(编译器插入 checkcast 等) + 运行时的自动类型转换。**所以,我们在理解和应用泛型时,一定要从编译期和运行时两个视角去分析。
类型参数推断: 当使用泛型类时,必须在创建对象的时候指定类型参数的值;而使用泛型方法时,通常不必指明参数类型(编译器类型参数推断的能力是有限的,有时我们必须显式的指明类型参数;但大多数情况下,编译器可以胜任这项任务),因为编译器会为我们找出具体类型(如 例1 所示)。但是编译器的类型推导能力是有限的,这种情况下,我们必须进行显式的类型实例化(如 例2 所示)。
例1:
在 java 1.7 以后,我们可以这样创建一个arraylist:
arraylist<string> list = new arraylist<>;
list 变量的类型就决定了它引用的动态数组所能存储的元素类型,即后者的类型参数可以从变量中推断出。
例2:
public class typeinference { public static <e> set<e> union(set<? extends e> s1, set<? extends e> s2) { set<e> result = new hashset<e>(s1); result.addall(s2); return result; } public static void main(string[] args) { set<integer> integers = new hashset<integer>(); set<double> doubles = new hashset<double>(); set<number> numbers = null; //编译器的类型推断能力有限 numbers = typeinference.union(integers, doubles); // error numbers = typeinference.<number>union(integers, doubles); // ok } }
如例2所示,为 numbers 赋值时需要显式对类型参数实例化。
2.定义与语法
泛型类(参数化类)
public class holder<t>{}
泛型接口(参数化接口)
public interface generator<t>{}
泛型方法(参数化方法;所在类可以是泛型类,也可以不是;能够独立于类而产生变化;细粒度)
public <t> void f(t x){}
3.注意事项
只有当你希望使用的参数类型比某个具体类型(以及它的所有子类型)更加泛化时————也就是说,当你的代码能够跨多个类工作时,使用泛型才有所帮助;否则,使用多态就可以满足要求。
public class hasf { public void f(){...} }//以下两种实现方式所取得的效果是一样的//泛型实现class manipulator1<t extends hasf>{ private t obj; public manipulator1(t x){ this.obj = x; } public void manipulate(){ obj.f(); } }//多态实现class manipulator2{ private hasf obj; public manipulator2(hasf x){ this.obj = x; } public void manipulate(){ obj.f(); } }
泛型类的识别(误区)
先看下面两段代码:
// 第一段代码public class pair<t> { private t first; private t second; public pair(t first, t second){ this.first = first; this.second = second; } public void setfirst(t first){ this.first = first; } public t getfirst(){ return first; } public void setsecond(t second){ this.second = second; } public t getsecond(){ return second; } }
// 第二段代码public class dateinterval extends pair<date> { // 时间间隔类 public dateinterval(date first, date second){ super(first, second); } @override public void setsecond(date second) { super.setsecond(second); } @override public date getsecond(){ return super.getsecond(); } }
由泛型类的定义可知,pair<t> 是一个泛型类,因为在类名后面有类型参数;类dateinterval 后面没有跟类型参数列表,因此该类就是一个 t 被替换为 date 的实体类,其从 pair<date>泛型类型 继承得到的方法列表,与泛型彻底无关。
对泛型类linkedlist<t>的类型参数t实例化所得到的不同泛型类型的理解
下图中,linkedlist<string>,linkedlist<point> 和 linkedlist<polyline> 是三种不同的类型,就像 integer 和 string 一样,是两种互不相同的类型。但是,三者共享同一个 class 对象,换句话说,三者在运行期的类型是一样的,但在编译期根据类型参数的不同成为截然不同的类型,下面代码可为例证。
public class testclasstypes { public static void main(string[] args) { linkedlist<string> proverbs = new linkedlist<>(); linkedlist<object> numbers = new linkedlist<>(); system.out.println("numbers class name: " + numbers.getclass().getname()); // output: java.util.linkedlist system.out.println("proverbs class name: " + proverbs.getclass().getname()); // output: java.util.linkedlist system.out.println("compare class objects: " + numbers.getclass().equals(proverbs.getclass())); // output:true // 由于 linkedlist<string> 与 linkedlist<object> 在编译期根本就是不同类型,所以下面代码编译不能通过: proverbs = (linkedlist<string>)numbers; // 类似于:把 integer 类型实例强制转型为 string实例 赋给 string引用 // 每个类都是 object 的子类 object obj = (object)numbers; system.out.println("obj class name " + obj.getclass().getname()); // output: java.util.linkedlist // 会有转型安全的异常 proverbs = (linkedlist<string>)obj; system.out.println("obj in proverbs class name " + obj.getclass().getname()); // output:java.util.linkedlist } }
在泛型类中, static 域或方法无法访问泛型类的类型参数;若静态方法需要使用泛型能力,就必须使其成为泛型方法(不与泛型类共享类型参数)
在一个类中,static 域或方法都是该类的 class对象的成员,而我们知道泛型所创造出来的所有类型都共享一个 calss对象, 因此实质上不受泛型参数限制,所以如下代码根本不能通过编译:
public class test2<t> { public static t one; //编译错误 public static t show(t one){ //编译错误 return null; } }
但是要注意区分下面的一种情况:
public class test2<t> { public static <t> t show(t one){//这是正确的 return null; } }
因为这是一个泛型方法,在泛型方法中使用的 类型参数t 是自己在方法中定义的t,而不是泛型类中的 t。
限制泛型可用的类型
在定义泛型类别时,预设可以使用任何的类型来实例化泛型类中的类型,但是如果想要限制使用泛型的类别时,即要求只能使用某个特定类型或者其子类型才能实例化该类型时,使用 extends 关键字指定这个类型必须是继承或者实现某个接口。一般地,当没有指定泛型继承的类型或实现的接口时,默认等价于使用 t extends object,因此,默认情形下任何类型都可以作为参数插入。特别地,为类型参数设定的第一个边界可以是类类型或接口类型,类型参数的第一个边界之后的任意额外边界都只能是接口类型,同时,一般将标记性接口放到靠后位置,这些类型参数之间有 & 相连接。
publc class myclass<t extends number & serilizable>{ ... }
在调用泛型方法的时候,可以指定泛型,也可以不指定泛型
在不指定泛型的情况下,泛型变量的类型为该方法中的几种类型的同一个父类的最小级,直到object; 在指定泛型的时候,该方法中的几种类型必须是该泛型实例类型或者其子类。
//代码示例public class test2{ public static void main(string[] args) { /**不指定泛型的时候*/ integer i = test2.add(1, 2); //这两个参数都是integer,所以t为integer类型 number f = test2.add(1, 1.2); //这两个参数一个是integer,一个是double,所以取同一父类的最小级,为number object o = test2.add(1, "asd"); //这两个参数一个是integer,一个是string,所以取同一父类的最小级,为object system.out.println(i.getclass().getname()); //输出: java.lang.integer system.out.println(f.getclass().getname()); //输出: java.lang.double system.out.println(o.getclass().getname()); //输出: java.lang.string /**指定泛型的时候*/ int a = test2.<integer>add(1, 2); //指定了integer,所以只能为integer类型或者其子类 int b = test2.<integer>add(1, 2.2); //编译错误,指定了integer,不能为double number c = test2.<number>add(1, 2.2); //指定为number,所以可以为integer和double } //这是一个简单的泛型方法 public static <t> t add(t x,t y){ return y; } }
注意,这个例子中的两个输出是java.lang.double和java.lang.string,而不是java.lang.number和
java.lang.object:
system.out.println(f.getclass().getname()); //输出: java.lang.doublesystem.out.println(o.getclass().getname()); //输出: java.lang.string
实际上,这个问题涉及泛型机制和多态两点。在例子中,类型参数t被编译器用number替换,这是没问题的,因为无论整形还是浮点型都属于数型,这是由多态机制保证的。但是,无论x还是y,它们本质上还是各自的类型不会发生任何改变。要注意的是,这里的getclass()方法返回的变量的实际类型,即运行时类型而非编译时类型,因此返回y的类型是double而非number。
泛型的兼容性
(1) 从泛型类型生成的任何类型的引用都能存储到对应的原生类型的变量中
linkedlist list = new linkedlist<string>();
这样编写代码是合法兼容的,但是,不应该将这作为日常编程习惯的一部分,因为这种实践存在固有的风险:由于类型安全性检查是针对引用的,所以上述写法和如下写法实质上是一样的:
linkedlist list = new linkedlist();
(2) 从原生类型生成的引用能存储到任何类型的泛型类型的变量中
linkedlist<string> list1 = new linkedlist(); linkedlist<integer> list2 = new linkedlist();
这样编写代码是合法兼容的,但是,由于我们可以将一个已经原生的 linkedlist对象 直接赋值此类引用,虽然在之后在添加元素是会进行类型安全检查,但之前的 linkedlist对象 所存储的元素可能五花八门,给程序带来隐患。具体请参照下图:
arraylist 中 get 方法的源码:
/** * returns the element at the specified position in this list. * * @param index index of the element to return * @return the element at the specified position in this list * @throws indexoutofboundsexception {@inheritdoc} */ public e get(int index) { rangecheck(index); return (e) elementdata[index]; // 只会让编译器认为该方法所返回的值是 e 类型,但此处转型不会起到预期效果,因为运行时 t 会被替换为 object !!! }
primitive类型不可以作为类型参数(八大类型)
若使用泛型方法可以取代将整个类泛型化,那么就应该使用泛型方法
泛型方法与可变参数列表可以很好的共存
public static <t> void f(t... args){}
三. 通配符及泛型的逆变和协变1、 通配符
(1) 无界通配符
 我们知道,通过为泛型类的每个类型形参提供类型实参,可以表达由这个泛型类定义的集合中的特定类型。例如,为了设定存储 string 的 arraylist<string> ,就将类型参数设定为 string,所以动态数组类型就是 arraylist<string>。若不想为泛型类的类型参数提供具体类型,可以将参数设定为 “?”,这就是通配符的作用, 通配符类型可以表示任何类或接口类型。
arraylist<?> list = new arraylist<string>(); list = new arraylist<double>(); list.add(e); // e cannot be resolved to a variable system.out.println(list1.size()); // ok
list 变量是arraylist<?>类型,所以能将指向任意类型的arraylist<>对象的引用存储在其中。但由于 list 是通配符类型参数的结果,所以存储引用的实际类型并不知道,因而无法使用这个变量调用任何与类型参数有关的方法。特别地,在 java 集合框架中,对于参数值是未知类型的容器类,只能读取其中元素,不能向其中添加元素, 因为,其类型未知,所以编译器无法识别添加元素的类型和容器的类型是否兼容,唯一的例外是 null(对 null 而言,无所谓类型)。
(2) 深入理解无界通配符
 我们有必要对以下三种类型进行区分:
list : 持有任何object类型 的 原生list,编译器不会对原生类型进行安全检查;
list<?> :具有某种特定类型 的 非原生list,编译器会进行安全检查;
list<object> : 编译器认为 list<object> 是 list<?> 的子类型;
public class wildcards { // raw argument: static void rawargs(holder holder, object arg) { holder.set(arg); // warning: holder.set(new wildcards()); // same warning // ok, but type information has been lost: object obj = holder.get(); } // similar to rawargs(), but errors instead of warnings: static void unboundedarg(holder<?> holder, object arg) { // holder.set(arg); // error: // holder.set(new wildcards()); // same error // ok, but type information has been lost: object obj = holder.get(); } }
2、 向上转型 / 通配符的上界 / 协变
在引入通配符的上界这一概念时,我们先看一下数组的一种特殊行为:基类型的数组引用可以被赋予导出类型的数组,如下面的代码所示:
class fruit {} class apple extends fruit {} class jonathan extends apple {} class orange extends fruit {} public class covariantarrays { public static void main(string[] args) { fruit[] fruit = new apple[10]; fruit[0] = new apple(); // 编译期、运行期都 ok fruit[1] = new jonathan(); // 编译期、运行期都 ok fruit[3] = new fruit(); // 编译期 ok、运行期抛出 java.lang.arraystoreexception(因为 fruit 的运行时类型是 apple[], 而不是 fruit[] 或 orange[]) // 说明 fruit[] 是 apple[] 的父类型 system.out.println(fruit[].class.isassignablefrom(apple[].class)); // true } }
由此可以说明:
由 12 行可知,该行代码编译期正常,则进一步说明:编译器的类型检查是针对引用的(fruit型数组可以放入fruit及其子类型对象);但在运行时,由于 fruit引用 实际上指的是一个 apple数组,而作为 apple数组 则只可以向其中放入apple及其子类型对象,因此当放入 fruit对象时,抛出异常。
由 15 行可知,fruit[] 是 apple[] 的父类型,因此根据java多态特性,前者可以指向后者对象。
我们知道,泛型的主要目标之一就是将这种错误检查移到编译期,那么,如果我们用泛型容器代替数组,那将会发生什么呢?
public class noncovariantgenerics { list<fruit> flist = new arraylist<apple>(); // compile error: type mismatch }
由以上代码可以知道,编译期根本不允许我们这么做。试想,如果编译期允许我们这样做,该容器就允许存入任何类型的对象,只要它是一种fruit,而不像数组那样会抛出运行时异常,违背了泛型的初衷(泛型保证容器的类型安全检查)。所以,在编译期看来,list<fruit> 和 list<fruit> 根本就是两种不同的类型,并无任何继承关系。
但是,有时你想要在以上两个类型之间建立某种向上转型关系,这就引出了通配符的上界。例如:
public class genericsandcovariance { public static void main(string[] args) { // 允许我们向上转型,向数组那样 list<? extends fruit> flist = arrays.aslist(new apple()); // compile error: can’t add any type of object: flist.add(new apple()); // compile error flist.add(new fruit()); // compile error flist.add(new object()); // compile error flist.add(null); // legal but uninteresting // we know that it returns at least fruit: fruit f = flist.get(0); object o = flist.get(0); apple a = flist.get(0); // compile error:type mismatch flist.contains(new apple()); // ok flist.indexof(new apple()); // ok } }
对于上述例子,flist 的类型就是list<? extends fruit>了,但这并不意味着可以向这个 list 可以添加任何类型的 fruit,甚至于不能添加 apple。虽然编译器知道这个 list 持有的是 fruit,但并不知道其具体持有哪种特定类型(可能是list<fruit>,list<apple>,list<orange>,list<jonathan>),所以编译器不知道该添加那种类型的对象才能保证类型安全(add 方法的参数为 “? extends fruit” ),因而编译器杜绝任何添加任何类型的 fruit。但是,对于诸如 get(int index)【我们进行读取操作时,编译器是允许的,而且编译器还知道 list 中的任何一个对象至少具有 fruit类型】、contains(object o) 和 indexof(object o) 等操作,由于其参数类型不涉及通配符,因此编译器允许调用这些操作。
因此,一旦执行这种向上转型,我们就丢掉向其中添加任何对象的能力。更一般地,编译器会直接拒绝对参数列表中涉及通配符的方法的调用。因此,这意味着将由泛型类的设计者来决定哪些调用地安全的,并使用 object类型 作为其参数类型,例如 contains 方法和 indexof 方法。例如,
public class holder<t> { private t value; public holder() { } public holder(t val) { value = val; } public void set(t val) { value = val; } public t get() { return value; } public boolean equals(object obj) { return value.equals(obj); } public static void main(string[] args) { holder<apple> apple = new holder<apple>(new apple()); apple d = apple.get(); apple.set(d); holder<? extends fruit> fruit = apple; // ok fruit p = fruit.get(); d = (apple) fruit.get(); // returns ‘fruit’,类型擦除,返回上界 // no warning,运行时异常 java.lang.classcastexception orange c = (orange) fruit.get(); // fruit.set(new apple()); // cannot call set(),参数列表含通配符 // fruit.set(new fruit()); // cannot call set(),参数列表含通配符 fruit.equals(d); // ok,参数列表不含通配符 } }
3、超类型通配符 / 通配符的下界 / 逆变
 我们可以使用超类型通配符指定通配符的下界, 方法是<? super myclass>,甚至可以用在类型参数上<? super myclass>(尽管我们不能对泛型参数给出一个超类型边界;即不能声明<t super myclass>)。这使得我们可以安全的传递一个对象到泛型类型中,因此,有了超类型通配符,就可以向 collection 写入了,如下图所示:
由图片可知,参数 apples 是 apple 或 apple的某种基类型 (例如:fruit,object,…) 的 list,也就是说,该 list 可以是 list<apple>, list<fruit> 或 list<object>等,但无论具体指的是哪一种,我们向其中添加 apple 或 apple的子类型 总是安全的。但编译器不允许向该 list 放入一个 fruit 对象, 因为 该list 的类型可能是 list<apple> , 这样将会违背泛型的本意。
 对于list<? super apple>,在读取容器元素时,由于该容器所包含的元素可能是 object类型、 fruit类型 和 apple类型,因此,从容器所读取到的元素只能确定是 object类型的,如下面图片所示:
4、协变与逆变
逆变与协变用来描述类型转换(type transformation)后的继承关系,其定义:如果 a,b 表示类型,f(⋅)表示类型转换,≤ 表示继承关系(比如,a ≤ b 表示a是b的子类);
f(⋅) 是逆变(contravariant)的,当 a≤b 时有 f(b)≤f(a) 成立;
f(⋅) 是协变(covariant)的,当 a≤b 时有 f(a)≤f(b) 成立;
f(⋅) 是不变(invariant)的,当 a≤b 时上述两个式子均不成立,即f(a)与f(b)相互之间没有继承关系。
接下来,我们看看java中的常见类型转换的协变性、逆变性或不变性:
  (1).泛型
 令f(a) = arraylist<a>,那么f(⋅) 是逆变、协变还是不变的呢?如果是逆变,则arraylist<integer>是arraylist<number>的父类型;如果是协变,则arraylist<integer>是arraylist<number>的子类型;如果是不变,二者没有相互继承关系。由于实际上arraylist<number>和arraylist<integer>无关,所以泛型是不变的。
(2).数组
 令f(a) = a[],容易证明数组是协变的:
number[] numbers = new integer[3];
5、实现泛型的协变与逆变
 我们知道java 中的泛型是不变的,可我们有时需要实现泛型的逆变与协变,怎么办呢? 这时,通配符 ? 派上了用场:
<? extends>实现了泛型的协变,比如:
arraylist<? extends apple> l3 = new arraylist<>(); arraylist<? extends fruit> l4 = new arraylist<>(); l4 = l3;
对于 arraylist<? extends apple> 类型,我们知道其表示某种具体类型(只是没有确定下来),但是无论其具体指的是arraylist<apple> 类型还是arraylist<jonathan> 类型,都是可以赋给arraylist<? extends fruit> 类型的引用的,反之则不可以。因此,我们可以认为arraylist<? extends fruit> 类型是arraylist<? extends apple> 类型的父类型,故 <? extends>实现了泛型的协变。
<? super>实现了泛型的逆变,比如:
arraylist<? super apple> l1 = new arraylist<>(); arraylist<? super fruit> l2 = new arraylist<>(); l1 = l2;
对于 arraylist<? super fruit> 类型,我们知道其表示某种具体类型(只是没有确定下来),但是无论其具体指的是arraylist<fruit> 类型还是arraylist<object> 类型,都是可以赋给arraylist<? super apple> 类型的引用的,反之则不可以。因此,我们可以认为arraylist<? super apple> 类型是arraylist<? super fruit> 类型的父类型,故 <? super>实现了泛型的逆变。
6、pecs 准则 (producer-extends, consumer-super)
 我们知道 <?> 表示:我想使用 java泛型 来编写代码,而不是用原生类型;但是在当前这种情况下,我并不能确定下泛型参数的具体类型,因此用?表示任何某种类型。因此,根据我们对通配符的了解,使用无界通配符的泛型类不能够写数据,而在读取数据时,所赋值的引用也只能是 object 类型。那么,我们究竟如何向泛型类写入、读取数据呢?
 《effective java2》给出了答案: pecs : producer(读取)-extends, consumer(写入)-super。换句话说,如果输入参数表示一个 t 的生产者,就使用<? extends t>;如果输入参数表示一个 t 的消费者,就使用<? super t>。总之,通配符类型可以保证方法能够接受它们应该接受的参数,并拒绝那些应该拒绝的参数。 比如,一个简单的 stack api :
public class stack<e>{ public stack(); public void push(e e); public e pop(); public boolean isempty(); }
现在要实现 pushall(iterable<e> src) 方法,将实现 iterable 接口的 src 的元素逐一入栈:
public void pushall(iterable<e> src){ for(e e : src) push(e) }
那么问题就来了:假设有一个实例化 stack<number> 的对象 stack(类型参数被实例化为number),显然, 我们向这个 stack 中加入 integer型或float型元素都是可以的,因为这些元素本来就是number型的。因此, src 就包括但不限于 iterable<integer> 与 iterable<float> 两种可能;这时,在调用上述 pushall方法 时,编译器就会产生 type mismatch 错误。原因是显而易见的,因为java中泛型是不变的,iterable<integer> 与 iterable<float> 都不是 iterable<number>及其子类型中的一种。所以,我们对 pushall方法 的设计就存在逻辑上的问题。因此,应改为
// wildcard type for parameter that serves as an e producerpublic void pushall(iterable<? extends e> src) { for (e e : src) push(e); }
这样,我们就可以实现将 实现iterable接口 的 e类型的容器中的元素读取到我们的 stack 中。
那么,如果现在要实现 popall(collection<e> dst)方法,将 stack 中的元素依次取出并添加到 dst 中,如果不用通配符实现:
// popall method without wildcard type - deficient!public void popall(collection<e> dst) { while (!isempty()) dst.add(pop()); }
同样地,假设有一个实例化 stack<number> 的对象 stack , dst 为 collection<object>,显然,这是合理的。但如果我们调用上述的 popall(collection<e> dst)方法,编译器会报出 type mismatch 错误,编译器不允许我们进行这样的操作。原因是显而易见的,因为 collection<object> 不是 collection<number>及其子类型的一种。所以,我们对 popall方法 的设计就存在逻辑上的问题。因此,应改为
// wildcard type for parameter that serves as an e consumerpublic void popall(collection<? super e> dst) { while (!isempty()) dst.add(pop()); }
这样,我们就可以实现将 stack<e> 中的 元素读取到我们的 collection 中 。
在上述例子中,在调用 pushall方法时 src生产了 e实例(produces e instances),在调用 popall方法时 dst消费了 e实例(consumes e instances)。naftalin与wadler 将 pecs 称为 get and put principle。
此外,我们再来学习一个例子: java.util.collections 的 copy 方法(jdk1.7),它的目的是将所有元素从一个列表(src)复制到另一个列表(dest)中。显然,在这里,src 是生产者,它负责产生 t类型的实例;dest 是消费者,它负责消费 t类型的实例。这完美地诠释了 pecs :
// list<? extends t> 类型的 src 囊括了所有 t类型及其子类型 的列表 // list<? super t> 类型的 dest 囊括了所有可以将 src中的元素添加进去的 list种类 public static <t> void copy(list<? super t> dest, list<? extends t> src) { // 将 src 复制到 dest 中 int srcsize = src.size(); if (srcsize > dest.size()) throw new indexoutofboundsexception("source does not fit in dest"); if (srcsize < copy_threshold || (src instanceof randomaccess && dest instanceof randomaccess)) { for (int i=0; i<srcsize; i++) dest.set(i, src.get(i)); } else { listiterator<? super t> di=dest.listiterator(); listiterator<? extends t> si=src.listiterator(); for (int i=0; i<srcsize; i++) { di.next(); di.set(si.next()); } } }
故有pecs总结:
 输入参数是生产者时,用 ? extends t ;
 输入参数是消费者时,用 ? super t ;
 输入参数既是生产者又是消费者时,那么通配符类型没什么用了:因为你需要的是严格类型匹配,这是不用任何通配符而得到的;
 无界通配符<?> 既不能做生产者(读出来的是object),又不能做消费者(写不进去);
四. 编译器如何处理泛型?通常情况下,一个编译器处理泛型有两种方式:
1、code specialization
在实例化一个泛型类或泛型方法时都产生一份新的目标代码(字节码or二进制代码)。例如,针对一个泛型list,可能需要针对string,integer,float产生三份目标代码。
2、code sharing
对每个泛型类只生成唯一的一份目标代码;该泛型类的所有实例都映射到这份目标代码上,在需要的时候执行类型检查和类型转换。
c++中的模板(template)是典型的code specialization实现
c++编译器会为每一个泛型类实例生成一份执行代码。执行代码中integer list和string list是两种不同的类型。这样会导致代码膨胀(code bloat),不过有经验的c++程序员可以有技巧的避免代码膨胀。 另外,在引用类型系统中,这种方式会造成空间的浪费。因为引用类型集合中元素本质上都是一个指针。没必要为每个类型都产生一份执行代码。而这也是java编译器中采用code sharing方式处理泛型的主要原因。
java 是典型的code sharing实现
java编译器通过code sharing方式为每个泛型类型创建唯一的字节码表示,并且将该泛型类型的实例都映射到这个唯一的字节码表示上。将多种泛型类形实例映射到唯一的字节码表示是通过类型擦除(type erasue)实现的。
五. 类型擦除1、要点
类型擦除: 通过移除泛型类定义的类型参数并将定义中每个类型变量替换成对应类型参数的非泛型上界(第一个边界),得到原生类型(raw type)
类型擦除是 java 泛型实现的一种折中,以便在不破坏现有类库的情况下,将泛型融入java,并且保证兼容性。(泛型出现前后的java类库互相兼容)
类型擦除指的是通过类型参数合并,将泛型类型实例关联到同一份字节码(class 对象)上。编译器只为泛型类型生成一份字节码,并将其实例关联到这份字节码上。类型擦除的关键在于从泛型类型中清除类型参数的相关信息,并且在必要的时候添加类型检查和类型转换的方法。
擦除是在编译期完成的。类型擦除可以简单的理解为将泛型java代码转换为普通java代码,只不过编译器更直接点,将泛型java代码直接转换成普通java字节码。泛型类型只有在静态类型检查期间才会出现,在此之后,程序中的所有泛型类型都将被擦除,并替换为它们的非泛型上界。因此,在泛型代码内部,无法获得任何有关泛型参数类型的信息。
2、编译器是如何配合类型擦除的?
3、类型擦除的主要过程
对于pair<>
//代码示例 aclass pair<t> { private t value; public t getvalue() { return value; } public void setvalue(t value) { this.value = value; } }
pair<>的原始类型为:
//代码示例 bclass pair { private object value; public object getvalue() { return value; } public void setvalue(object value) { this.value = value; } }
以下类型擦除示例:
//代码示例 1interface comparable <a> { public int compareto( a that); }
//代码示例 2final class numericvalue implements comparable <numericvalue> { priva byte value; public numericvalue (byte value) { this.value = value; } public byte getvalue() { return value; } public int compareto( numericvalue that) { return this.value - that.value; } }
//代码示例 3class collections { public static <a extends comparable<a>> a max(collection <a> xs) { iterator<a> xi = xs.iterator(); a w = xi.next(); while(xi.hasnext()) { a x = xi.next(); if(w.compareto(x) < 0) w = x; } return w; } }
//代码示例 4final class test { public static void main (string[] args) { linkedlist<numericvalue> numberlist = new linkedlist<numericvalue> (); numberlist.add(new numericvalue((byte)0)); numberlist.add(new numericvalue((byte)1)); numericvalue y = collections.max( numberlist ); } }
类型擦除后:
//代码示例 1 interface comparable { public int compareto( object that); }
//代码示例 2final class numericvalue implements java.lang.comparable{ //域 private byte value; //构造器 public numericvalue(byte); //方法 public int compareto(numericvalue); public volatile int compareto(java.lang.object); //桥方法 public byte getvalue( ); }
//代码示例 3class collections { public static comparable max(collection xs) { iterator xi = xs.iterator(); comparable w = (comparable) xi.next(); while (xi.hasnext()) { comparable x = (comparable) xi.next(); if (w.compareto(x) < 0) w = x; } return w; } }
//代码示例 4final class test { public static void main (string[ ] args) { linkedlist numberlist = new linkedlist(); numberlist.add(new numericvalue((byte)0)); , numberlist.add(new numericvalue((byte)1)); numericvalue y = (numericvalue) collections.max( numberlist ); } }
第一个泛型类被擦除后, a被替换为最左边界 object。由于comparable是一个泛型接口,所以comparable的类型参数numericvalue被擦除掉并将相关参数置换为 object,但是这直接导致 numericvalue 没有实现接口(重写)comparable的compareto(object that)方法,于是编译器充当好人,添加了一个桥方法(由编译器在编译时自动添加)。
第二个示例中限定了类型参数的边界,a必须为comparable的子类,按照类型擦除的过程,先将所有的类型参数替换为最左边界comparable,得到最终的擦除后结果。
六. 泛型带来的问题及解决方法1、以参数化类型与原始类型的兼容性说明引用是类型检查所针对的对象
public class test10 { public static void main(string[] args) { arraylist<string> arraylist1=new arraylist(); arraylist1.add("1"); //编译通过 arraylist1.add(1); //编译错误 string str1=arraylist1.get(0); //返回类型就是 string arraylist arraylist2=new arraylist<string>(); arraylist2.add("1"); //编译通过 arraylist2.add(1); //编译通过 object object=arraylist2.get(0); //返回类型就是 object new arraylist<string>().add("11"); //编译通过 new arraylist<string>().add(22); //编译错误 string string=new arraylist<string>().get(0); //返回类型就是 string } }
因此我们可以得出结论:类型检查就是针对引用的,谁是一个引用,用这个引用调用泛型方法,就会对这个引用调用的方法进行类型检测,而无关它真正引用的对象。
2、所有动作都发生在边界处(对传递进来的值,编译器进行额外的检查;对真正传递出去的值,编译器自动插入的转型)
因为类型擦除的问题,所以所有的泛型类型最后都会被替换为原始类型。这样就引起了一个问题,既然都被替换为原始类型,那么为什么我们在获取的时候,不需要进行强制类型转换呢?
先看下面非泛型示例:
// 代码片段1public class simpleholder { private object obj; public void setobj(object obj) { this.obj = obj; } public object getobj() { return obj; } public static void main(string[] args) { simpleholder holder = new simpleholder(); holder.setobj("item"); string s = (string)holder.getobj(); } }
反编译这个类,得到下面代码片段:
public void setobj(java.lang.object); code: 0: aload_0 1: aload_1 2: putfield #2; //field obj:ljava/lang/object; 5: returnpublic java.lang.object getobj(); code: 0: aload_0 1: getfield #2; //field obj:ljava/lang/object; 4: areturnpublic static void main(java.lang.string[]); code: 0: new #3; //class simpleholder 3: dup 4: invokespecial #4; //method "<init>":()v 7: astore_1 8: aload_1 9: ldc #5; //string item 11: invokevirtual #6; //method setobj:(ljava/lang/object;)v 14: aload_1 15: invokevirtual #7; //method getobj:()ljava/lang/object; 18: checkcast #8; //class java/lang/string 21: astore_2 22: return
现将泛型应用到上述代码,如下:
// 代码片段 2public class genericholder<t> { private t obj; public void setobj(t obj) { this.obj = obj; } public t getobj() { return obj; } public static void main(string[] args) { genericholder<string> holder = new genericholder<string>(); holder.setobj("item"); string s = holder.getobj(); } }
反编译这个类,得到下面代码片段:
public void setobj(java.lang.object); code: 0: aload_0 1: aload_1 2: putfield #2; //field obj:ljava/lang/object; 5: returnpublic java.lang.object getobj(); code: 0: aload_0 1: getfield #2; //field obj:ljava/lang/object; 4: areturnpublic static void main(java.lang.string[]); code: 0: new #3; //class genericholder 3: dup 4: invokespecial #4; //method "<init>":()v 7: astore_1 8: aload_1 9: ldc #5; //string item 11: invokevirtual #6; //method setobj:(ljava/lang/object;)v 14: aload_1 15: invokevirtual #7; //method getobj:()ljava/lang/object; 18: checkcast #8; //class java/lang/string 21: astore_2 22: return
在上述应用泛型的代码中,将
string s = holder.getobj();
替换为
holder.getobj();
反编译后,有代码片段:
public void setobj(java.lang.object); code: 0: aload_0 1: aload_1 2: putfield #2; //field obj:ljava/lang/object; 5: returnpublic java.lang.object getobj(); code: 0: aload_0 1: getfield #2; //field obj:ljava/lang/object; 4: areturnpublic static void main(java.lang.string[]); code: 0: new #3; //class genericholder 3: dup 4: invokespecial #4; //method "<init>":()v 7: astore_1 8: aload_1 9: ldc #5; //string item 11: invokevirtual #6; //method setobj:(ljava/lang/object;)v 14: aload_1 15: invokevirtual #7; //method getobj:()ljava/lang/object; 18: pop 19: return}
首先,代码片段 1 和代码片段 2 二者所产生的字节码是相同的。看第15,它调用的是getobj()方法,返回值是object,说明类型擦除了。然后第18,它做了一个checkcast操作,即检查类型#8, 在上面找#8引用的类型,它是一个string类型,即作string类型的强转。所以不是在get方法里强转的,是在你调用的地方强转的。对进入setobj()的类型进行检查是不需要的,因为这将由编译器执行。而对从getobj()返回的值进行转型仍旧是需要的,但这与你自己必须执行的操作是一样的–此处它将由编译器自动插入。也就是说,在泛型中,所有动作都发生在边界处 – 对传递进来的值进行额外的编译器检查,并由编译器自动插入对传递出去的值的转型。
其次,在未将 getobj() 的值赋给string时,由代码片段可知,编译器并未自动插入转型代码,可见所谓编译器自动插入对传递出去的值的转型的前提条件是:其必须是真正传递出去,即必须赋值给引用.(当然,虽然 getobj() 的返回值的类型是 object, 但是其实质上是一个 string, 因此直接进行操作 “ getobj() instanceof string ”时,返回值也是 true.)
再看一段代码:
public class genericarray<t> { private t[] array; public genericarray(int sz) { array = (t[]) new object[sz]; } public void put(int index, t item) { array[index] = item; } public t get(int index) { return array[index]; } public t[] rep() { return array; } public static void main(string[] args) { genericarray<integer> gai = new genericarray<integer>(10); gai.put(0, new integer(4)); gai.get(0); integer i = gai.get(0); // this causes a classcastexception: integer[] ia = gai.rep(); // this is ok: object[] oa = (object[])gai.rep(); } }
反编译得代码段:
public class genericarray extends java.lang.object{public genericarray(int); code: 0: aload_0 1: invokespecial #1; //method java/lang/object."<init>":()v 4: aload_0 5: iload_1 6: anewarray #2; //class java/lang/object 9: checkcast #3; //class "[ljava/lang/object;" 12: putfield #4; //field array:[ljava/lang/object; 15: returnpublic void put(int, java.lang.object); code: 0: aload_0 1: getfield #4; //field array:[ljava/lang/object; 4: iload_1 5: aload_2 6: aastore 7: returnpublic java.lang.object get(int); code: 0: aload_0 1: getfield #4; //field array:[ljava/lang/object; 4: iload_1 5: aaload 6: areturnpublic java.lang.object[] rep(); code: 0: aload_0 1: getfield #4; //field array:[ljava/lang/object; 4: areturnpublic static void main(java.lang.string[]); code: 0: new #5; //class genericarray 3: dup 4: bipush 10 6: invokespecial #6; //method "<init>":(i)v 9: astore_1 10: aload_1 11: iconst_0 12: new #7; //class java/lang/integer 15: dup 16: iconst_4 17: invokespecial #8; //method java/lang/integer."<init>":(i)v 20: invokevirtual #9; //method put:(iljava/lang/object;)v 23: aload_1 24: iconst_0 25: invokevirtual #10; //method get:(i)ljava/lang/object; 28: pop 29: aload_1 30: iconst_0 31: invokevirtual #10; //method get:(i)ljava/lang/object; 34: checkcast #7; //class java/lang/integer 37: astore_2 38: aload_1 39: invokevirtual #11; //method rep:()[ljava/lang/object; 42: checkcast #12; //class "[ljava/lang/integer;" 45: astore_3 46: aload_1 47: invokevirtual #11; //method rep:()[ljava/lang/object; 50: checkcast #3; //class "[ljava/lang/object;" 53: astore 4 55: return}
结合上面的结论,仔细观察反编译后代码中 checkcast 都用在什么地方,加深对边界就是发生动作的地方和自动转型发生在调用处(需要检验两种类型时)的理解。
25显示调用后,直接pop,而31显示在调用处,还要进行 checkcast 操作;
由于类型擦除,操作39之后,进行 checkcast 操作,强转为 ljava.lang.integer ,但是由代码【 array = (t[]) new object[sz]; 】可知,其 new 的是 object 数组,是不可能成功强转到 integer 数组的,就像 object 对象不能成功强转到 integer 对象一样,会在运行时抛出 classcastexception 异常;
由于类型擦除,操作47之后,进行 checkcast 操作,由于 rep() 返回的即为 object 数组,而其要赋给的引用也是 object[] ,因此不会抛出任何异常。
3、类型擦除与多态的冲突及其解决办法
先看两段代码:
// 第一段代码public class pair<t> { private t first; private t second; public pair(t first, t second){ this.first = first; this.second = second; } public void setfirst(t first){ this.first = first; } public t getfirst(){ return first; } public void setsecond(t second){ this.second = second; } public t getsecond(){ return second; } }
// 第二段代码public class dateinterval extends pair<date> { // 时间间隔类 public dateinterval(date first, date second){ super(first, second); } @override public void setsecond(date second) { super.setsecond(second); } @override public date getsecond(){ return super.getsecond(); } public static void main(string[] args) { dateinterval interval = new dateinterval(new date(), new date()); pair<date> pair = interval; //超类,多态 date date = new date(2000, 1, 1); system.out.println("原来的日期:"+pair.getsecond()); system.out.println("set进新日期:"+date); pair.setsecond(date); system.out.println("执行pair.setsecond(date)后的日期:"+pair.getsecond()); } }
原本子类重写父类的方法,无可非议。但是泛型类的类型擦除造成了一个问题,pair的原始类型中存在方法:
public void setsecond(object second);
dateinterval中的方法:
public void setsecond(date second);
我们的本意是想重写父类pair中的setsecond方法,但是从方法签名上看,这完全是两个不同的方法,类型擦除与多态产生了冲突。而实际情况呢?运行dateinterval的main方法,我们看到
public void setsecond(date second)的确重写了public void setsecond(object second)方法。这是如何做到的呢?
使用java类分析器对其进行分析,结果:
public class dateinterval extends pair{ //构造器 public dateinterval(java.util.date, java.util.date); //方法 public void setsecond(java.util.date); public volatile void setsecond(java.lang.object); //方法 1 public java.util.date getsecond( ); //方法 2 public volatile java.lang.object getsecond( ); //方法 3,它难道不会和方法 2 冲突? public static void main(java.lang.string[]); }
方法1和方法3是我们在源码中不曾定义的,它肯定是由编译器生成的。这个方法称为 桥方法(bridge method),真正覆写超类方法的是它。语句pair.setsecond(date)实际上调用的是方法1[public volatile void setsecond(object)],通过这个方法再去调用public void setsecond(date)。这个桥方法的实际内容是:
public void setsecond(object second){ this.setsecond((java.util.date) second); }
这样的结果就符合面向对象中多态的特性了,实现了方法的动态绑定。但是,这样的做法给我们带来了一种错觉,就认为public void setsecond(date)覆写了泛型类的public void setsecond(object)【其实也不是重写,二者方法参数都不同】,如果我们在dateinterval中增加一个方法:
public void setsecond(object obj){ system.out.println("覆写超类方法!"); }
编译器会报如下错误:name clash: the method setsecond(object) of type dateinter has the same erasure as setsecond(t) of type pair<t> but doesn't override it.即,同一个方法不能被重写两次。
为了实现多态,我们知道方法3也是由编译器生成的桥方法。方法擦除带来的第二个问题就是:由编译器生成的桥方法 public volatile java.lang.object getsecond() 方法和 public java.util.date getsecond() 方法,从方法签名的角度看是两个完全相同的方法,它们怎么可以共存呢? 如果是我们自己编写java代码,这样的代码是无法通过编译器的检查的,但是虚拟机却是允许这样做的,因为虚拟机通过参数类型和返回类型来确定一个方法,所以编译器为了实现泛型的多态允许自己做这个看起来“不合法”的事情。
补充说明:
从jdk1.5开始,在一个方法覆盖另一个方法时可以指定一个更严格(窄)的返回类型,它的机制也是同样使用的桥方法。 例如,
public class a { public list getlist(){ return null; } }public class asub extends a{ @override public arraylist getlist(){ return null; } }
使用java 类分析器对asub分析可得:
public class asub extends a{ //域 //构造器 public asub( ); //方法 public java.util.arraylist getlist( ); public volatile java.util.list getlist( ); //桥方法}
4、泛型类型变量不能是基本数据类型
类型参数不能是基本类型。也就是说,没有arraylist<double>,只有arraylist<double>。因为当类型擦除后,arraylist的原始类型变为object,但是object类型不能存储double值,只能引用double的值。
解决之道: 使用基本类型的包装器类以及java se5的自动包装机制。
5、转型和警告
使用带有泛型类型参数的转型或 instanceof 不会有任何效果,例如:
class fixedsizestack<t> { private int index = 0; private object[] storage; public fixedsizestack(int size) { storage = new object[size]; } public void push(t item) { storage[index++] = item; } public t pop() { //warnning: unchecked cast from object to t return (t) storage[--index]; } }public class genericcast { public static final int size = 10; public static void main(string[] args) { fixedsizestack<string> strings = new fixedsizestack<string>(size); for (string s : "a b c d e f g h i j".split(" ")) strings.push(s); for (int i = 0; i < size; i++) { string s = strings.pop(); system.out.print(s + " "); } } }
由于擦除的原因,t 被擦除到它的第一个边界 object,因此pop()实际上只是将object转型为object。换句话说,pop()方法实际上并没有执行任何转型。
6、任何在运行时需要知道确切类型信息的操作都将无法工作
instanceof操作 的右操作数不能带有泛型类型参数;
new 操作 :可以 new 泛型类型(eg: arraylist,…),但不能 new 泛型参数(t,…);
泛型数组 :不可以创建带有泛型类型参数的数组(若需要收集参数化类型对象,可以直接使用 arraylist:arraylist<pair<string>>最安全且有效。);
转型 :带有泛型类型参数的转型不会有任何效果;
例如:
关于由类型擦除引起的 instance of t,new t 和创建数组t 等问题,可以引入类型标签class<t>来解决,例如:
class building {} class house extends building {}public class classtypecapture<t> { class<t> kind; public classtypecapture(class<t> kind) { this.kind = kind; } public boolean f(object arg) { return kind.isinstance(arg); } public static void main(string[] args) { classtypecapture<building> ctt1 = new classtypecapture<building>(building.class); system.out.println(ctt1.f(new building())); // true system.out.println(ctt1.f(new house())); // true classtypecapture<house> ctt2 = new classtypecapture<house>(house.class); system.out.println(ctt2.f(new building())); // true system.out.println(ctt2.f(new house())); // true } }
7、实现参数化接口
一个类不能实现同一个泛型接口的两种变体,由于擦除的原因,这两个变体会成为相同的接口,例如:
public person implements comparable<person>{ ... } // ok class honorperson extends person implements comparable<honorperson>{ ... } // error
honorperson 类不能编译,因为擦除会将comparable<person>和comparable<honorperson>简化为相同的接口 comparable, 上面的代码意味着重复实现相同的接口。但是,下面的代码可以通过编译:
public person implements comparable{ ... } // ok class honorperson extends person implements comparable{ ... } // ok
这种差别在于:编译器对泛型的特别处理方式。
8、异常中使用泛型的问题
由于类型擦除的原因,将泛型应用于异常是非常受限的。catch 语句不能捕获泛型类型的异常,因为在编译期和运行时都必须知道异常的确切类型。
不能抛出也不能捕获泛型类的对象
 事实上,泛型类扩展throwable都不合法(exception是throwable的子类)。例如:下面的定义将不会通过编译
public class problem<t> extends exception{......}
为什么不能扩展throwable,因为异常都是在运行时捕获和抛出的,而在编译的时候,泛型信息全都会被擦除掉,那么,假设上面的编译可行,那么,再看下面的定义:
try{ }catch(problem<integer> e1){ ... }catch(problem<number> e2){ ... }
在运行时,类型信息被擦除后,那么两个地方的catch都变为原始类型object,那么也就是说,这两个地方的catch变的一模一样,就“相当于”下面的这样:
try{ }catch(problem<object> e1){ ... }catch(problem<object> e2){ ... }
这当然就是不行的, 就好像catch了两个一模一样的普通异常,编译器就不能通过编译一样。
不能再catch子句中使用泛型变量
例如:
public static <t extends throwable> void dowork(class<t> t){ try{ ... }catch(t e){ //编译错误 ... } }
因为泛型信息在编译的时候已经变为原始类型,也就是说上面的 t 会变为原始类型throwable,那么如果可以再catch子句中使用泛型变量,那么,下面的定义呢:
public static <t extends throwable> void dowork(class<t> t){ try{ ... }catch(t e){ //编译错误 ... }catch(indexoutofbounds e){ } }
根据异常捕获的原则,一定是子类在前面,父类在后面,那么上面就违背了这个原则。所以java为了避免这样的情况,禁止在catch子句中使用泛型变量。
类型变量可以使用在异常声明中
public static<t extends throwable> void dowork(t t) throws t{ try{ ... }catch(throwable realcause){ t.initcause(realcause); throw t; }
此时,虽然t也会被擦除为throwable,但由于用在声明中,因此是合法的。
9、类型擦除后的冲突
当泛型类型被擦除后,创建条件不能产生冲突:
class pair<t> { public boolean equals(t value) { return null; } }
考虑pair<>:
public boolean equals(t value){}
擦除后变为
boolean equals(object)
这与 object.equals 方法是冲突的!当然,补救的办法是重新命名引发错误的方法。
10、动态类型安全
先看以下代码:
public class checkedlist { @suppresswarnings("unchecked") static void oldstylemethod(list probablydogs) { //原生list probablydogs.add(new cat()); } public static void main(string[] args) { list<dog> dogs1 = new arraylist<dog>(); oldstylemethod(dogs1); // quietly accepts a cat list<dog> dogs2 = collections.checkedlist( new arraylist<dog>(), dog.class); try { oldstylemethod(dogs2); // throws an exception } catch(exception e) { system.out.println(e); } // derived types work fine: list<pet> pets = collections.checkedlist( new arraylist<pet>(), pet.class); pets.add(new dog()); pets.add(new cat()); } } /* output: java.lang.classcastexception: attempt to insert class typeinfo.pets.cat element into collection with element type class typeinfo.pets.dog
使用 collections 的静态方法:checkedcollection( ), checkedlist( ), checkedmap( ), checkedset( ),  
checkedsortedmap( ) 和 checkedsortedset( ) 可以在运行时便知道罪魁祸首在哪里,而不必等到将对象从容器中取出时。
以上就是java 泛型(generics) 综述示例代码详解的详细内容。
其它类似信息

推荐信息