访问者模式(下):为什么支持双分派的语言不需要访问者模式?
# 69 | 访问者模式(下):为什么支持双分派的语言不需要访问者模式?
上一节课中,我们学习了访问者模式的原理和实现,并且还原了访问者模式诞生的思维过程。总体上来讲,这个模式的代码实现比较难,所以应用场景并不多。从应用开发的角度来说,它的确不是我们学习的重点。
不过,我们前面反复说过,学习我的专栏,并不只是让你掌握知识,更重要的是锻炼你分析、解决问题的能力,锻炼你的逻辑思维能力,所以,今天我们继续把访问者模式作为引子,一块讨论一下这样两个问题,希望能激发你的深度思考:
为什么支持双分派的语言不需要访问者模式呢?
除了访问者模式,上一节课中的例子还有其他实现方案吗?
话不多说,让我们正式开始今天的学习吧!
# 为什么支持双分派的语言不需要访问者模式?
实际上,讲到访问者模式,大部分书籍或者资料都会讲到DoubleDispatch,中文翻译为双分派。虽然学习访问者模式,并不用非得理解这个概念,我们前面的讲解就没有提到它,但是,为了让你在查看其它书籍或者资料的时候,不会卡在这个概念上,我觉得有必要在这里讲一下。
除此之外,我觉得,学习DoubleDispatch还能加深你对访问者模式的理解,而且能一并帮你搞清楚今天文章标题中的这个问题:为什么支持双分派的语言就不需要访问者模式?这个问题在面试中可是会被问到的哦!
既然有DoubleDispatch,对应的就有SingleDispatch。所谓SingleDispatch,指的是执行哪个对象的方法,根据对象的运行时类型来决定;执行对象的哪个方法,根据方法参数的编译时类型来决定。所谓DoubleDispatch,指的是执行哪个对象的方法,根据对象的运行时类型来决定;执行对象的哪个方法,根据方法参数的运行时类型来决定。
如何理解“Dispatch”这个单词呢?在面向对象编程语言中,我们可以把方法调用理解为一种消息传递,也就是“Dispatch”。一个对象调用另一个对象的方法,就相当于给它发送一条消息。这条消息起码要包含对象名、方法名、方法参数。
如何理解“Single”“Double”这两个单词呢?“Single”“Double”指的是执行哪个对象的哪个方法,跟几个因素的运行时类型有关。我们进一步解释一下。SingleDispatch之所以称为“Single”,是因为执行哪个对象的哪个方法,只跟“对象”的运行时类型有关。DoubleDispatch之所以称为“Double”,是因为执行哪个对象的哪个方法,跟“对象”和“方法参数”两者的运行时类型有关。
具体到编程语言的语法机制,SingleDispatch和DoubleDispatch跟多态和函数重载直接相关。当前主流的面向对象编程语言(比如,Java、C++、C#)都只支持SingleDispatch,不支持DoubleDispatch。
接下来,我们拿Java语言来举例说明一下。
Java支持多态特性,代码可以在运行时获得对象的实际类型(也就是前面提到的运行时类型),然后根据实际类型决定调用哪个方法。尽管Java支持函数重载,但Java设计的函数重载的语法规则是,并不是在运行时,根据传递进函数的参数的实际类型,来决定调用哪个重载函数,而是在编译时,根据传递进函数的参数的声明类型(也就是前面提到的编译时类型),来决定调用哪个重载函数。也就是说,具体执行哪个对象的哪个方法,只跟对象的运行时类型有关,跟参数的运行时类型无关。所以,Java语言只支持SingleDispatch。
这么说比较抽象,我举个例子来具体说明一下,代码如下所示:
public class ParentClass {
public void f() {
System.out.println("I am ParentClass's f().");
}
}
public class ChildClass extends ParentClass {
public void f() {
System.out.println("I am ChildClass's f().");
}
}
public class SingleDispatchClass {
public void polymorphismFunction(ParentClass p) {
p.f();
}
public void overloadFunction(ParentClass p) {
System.out.println("I am overloadFunction(ParentClass p).");
}
public void overloadFunction(ChildClass c) {
System.out.println("I am overloadFunction(ChildClass c).");
}
}
public class DemoMain {
public static void main(String[] args) {
SingleDispatchClass demo = new SingleDispatchClass();
ParentClass p = new ChildClass();
demo.polymorphismFunction(p);//执行哪个对象的方法,由对象的实际类型决定
demo.overloadFunction(p);//执行对象的哪个方法,由参数对象的声明类型决定
}
}
//代码执行结果:
I am ChildClass's f().
I am overloadFunction(ParentClass p).
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
在上面的代码中,第31行代码的polymorphismFunction()函数,执行p的实际类型的f()函数,也就是ChildClass的f()函数。第32行代码的overloadFunction()函数,匹配的是重载函数中的overloadFunction(ParentClassp),也就是根据p的声明类型来决定匹配哪个重载函数。
假设Java语言支持DoubleDispatch,那下面的代码(摘抄自上节课中第二段代码,建议结合上节课的讲解一块理解)中的第37行就不会报错。代码会在运行时,根据参数(resourceFile)的实际类型(PdfFile、PPTFile、WordFile),来决定使用extract2txt的三个重载函数中的哪一个。那下面的代码实现就能正常运行了,也就不需要访问者模式了。这也回答了为什么支持DoubleDispatch的语言不需要访问者模式。
public abstract class ResourceFile {
protected String filePath;
public ResourceFile(String filePath) {
this.filePath = filePath;
}
}
public class PdfFile extends ResourceFile {
public PdfFile(String filePath) {
super(filePath);
}
//...
}
//...PPTFile、WordFile代码省略...
public class Extractor {
public void extract2txt(PPTFile pptFile) {
//...
System.out.println("Extract PPT.");
}
public void extract2txt(PdfFile pdfFile) {
//...
System.out.println("Extract PDF.");
}
public void extract2txt(WordFile wordFile) {
//...
System.out.println("Extract WORD.");
}
}
public class ToolApplication {
public static void main(String[] args) {
Extractor extractor = new Extractor();
List<ResourceFile> resourceFiles = listAllResourceFiles(args[0]);
for (ResourceFile resourceFile : resourceFiles) {
extractor.extract2txt(resourceFile);
}
}
private static List<ResourceFile> listAllResourceFiles(String resourceDirectory) {
List<ResourceFile> resourceFiles = new ArrayList<>();
//...根据后缀(pdf/ppt/word)由工厂方法创建不同的类对象(PdfFile/PPTFile/WordFile)
resourceFiles.add(new PdfFile("a.pdf"));
resourceFiles.add(new WordFile("b.word"));
resourceFiles.add(new PPTFile("c.ppt"));
return resourceFiles;
}
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
# 除了访问者模式,上一节的例子还有其他实现方案吗?
上节课,我通过一个例子来给你展示了,访问者模式是如何一步一步设计出来的。我们这里再一块回顾一下那个例子。我们从网站上爬取了很多资源文件,它们的格式有三种:PDF、PPT、Word。我们要开发一个工具来处理这批资源文件,这其中就包含抽取文本内容、压缩资源文件、提取文件元信息等。
实际上,开发这个工具有很多种代码设计和实现思路。为了讲解访问者模式,上节课我们选择了用访问者模式来实现。实际上,我们还有其他的实现方法,比如,我们还可以利用工厂模式来实现,定义一个包含extract2txt()接口函数的Extractor接口。PdfExtractor、PPTExtractor、WordExtractor类实现Extractor接口,并且在各自的extract2txt()函数中,分别实现Pdf、PPT、Word格式文件的文本内容抽取。ExtractorFactory工厂类根据不同的文件类型,返回不同的Extractor。
这个实现思路其实更加简单,我们直接看代码。
public abstract class ResourceFile {
protected String filePath;
public ResourceFile(String filePath) {
this.filePath = filePath;
}
public abstract ResourceFileType getType();
}
public class PdfFile extends ResourceFile {
public PdfFile(String filePath) {
super(filePath);
}
@Override
public ResourceFileType getType() {
return ResourceFileType.PDF;
}
//...
}
//...PPTFile/WordFile跟PdfFile代码结构类似,此处省略...
public interface Extractor {
void extract2txt(ResourceFile resourceFile);
}
public class PdfExtractor implements Extractor {
@Override
public void extract2txt(ResourceFile resourceFile) {
//...
}
}
//...PPTExtractor/WordExtractor跟PdfExtractor代码结构类似,此处省略...
public class ExtractorFactory {
private static final Map<ResourceFileType, Extractor> extractors = new HashMap<>();
static {
extractors.put(ResourceFileType.PDF, new PdfExtractor());
extractors.put(ResourceFileType.PPT, new PPTExtractor());
extractors.put(ResourceFileType.WORD, new WordExtractor());
}
public static Extractor getExtractor(ResourceFileType type) {
return extractors.get(type);
}
}
public class ToolApplication {
public static void main(String[] args) {
List<ResourceFile> resourceFiles = listAllResourceFiles(args[0]);
for (ResourceFile resourceFile : resourceFiles) {
Extractor extractor = ExtractorFactory.getExtractor(resourceFile.getType());
extractor.extract2txt(resourceFile);
}
}
private static List<ResourceFile> listAllResourceFiles(String resourceDirectory) {
List<ResourceFile> resourceFiles = new ArrayList<>();
//...根据后缀(pdf/ppt/word)由工厂方法创建不同的类对象(PdfFile/PPTFile/WordFile)
resourceFiles.add(new PdfFile("a.pdf"));
resourceFiles.add(new WordFile("b.word"));
resourceFiles.add(new PPTFile("c.ppt"));
return resourceFiles;
}
}
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
当需要添加新的功能的时候,比如压缩资源文件,类似抽取文本内容功能的代码实现,我们只需要添加一个Compressor接口,PdfCompressor、PPTCompressor、WordCompressor三个实现类,以及创建它们的CompressorFactory工厂类即可。唯一需要修改的只有最上层的ToolApplication类。基本上符合“对扩展开放、对修改关闭”的设计原则。
对于资源文件处理工具这个例子,如果工具提供的功能并不是非常多,只有几个而已,那我更推荐使用工厂模式的实现方式,毕竟代码更加清晰、易懂。相反,如果工具提供非常多的功能,比如有十几个,那我更推荐使用访问者模式,因为访问者模式需要定义的类要比工厂模式的实现方式少很多,类太多也会影响到代码的可维护性。
# 重点回顾
好了,今天内容到此就讲完了。我们一块来总结回顾一下,你需要重点掌握的内容。
总体上来讲,访问者模式难以理解,应用场景有限,不是特别必需,我不建议在项目中使用它。所以,对于上节课中的处理资源文件的例子,我更推荐使用工厂模式来设计和实现。
除此之外,我们今天重点讲解了DoubleDispatch。在面向对象编程语言中,方法调用可以理解为一种消息传递(Dispatch)。一个对象调用另一个对象的方法,就相当于给它发送一条消息,这条消息起码要包含对象名、方法名和方法参数。
所谓SingleDispatch,指的是执行哪个对象的方法,根据对象的运行时类型来决定;执行对象的哪个方法,根据方法参数的编译时类型来决定。所谓DoubleDispatch,指的是执行哪个对象的方法,根据对象的运行时类型来决定;执行对象的哪个方法,根据方法参数的运行时类型来决定。
具体到编程语言的语法机制,SingleDispatch和DoubleDispatch跟多态和函数重载直接相关。当前主流的面向对象编程语言(比如,Java、C++、C#)都只支持SingleDispatch,不支持DoubleDispatch。
# 课堂讨论
访问者模式将操作与对象分离,是否违背面向对象设计原则?你怎么看待这个问题呢?
在解释 Single Dispatch 的代码示例中,如果我们把 SingleDispatchClass 的代码改成下面这样,其他代码不变,那 DemoMain 的输出结果会是什么呢?为什么会是这样的结果呢?
public class SingleDispatchClass {
public void polymorphismFunction(ParentClass p) {
p.f();
}
public void overloadFunction(ParentClass p) {
p.f();
}
public void overloadFunction(ChildClass c) {
c.f();
}
}
2
3
4
5
6
7
8
9
10
11
12
13
14
欢迎留言和我分享你的想法。如果有收获,也欢迎你把这篇文章分享给你的朋友。
# 精选评论
点击查看
课后思考:
1. 看要怎么理解这个问题了,简单来看将操作与对象分离是违背了面向对象的设计原则,但从另外的角度看,将操作也看做对象,然后将不同的对象进行组合,那么并不违背面向对象的设计,而且在访问者模式中,操作可能不断增加,是属于是变化比较多的,将不变的部分和可变的部分开,然后使用组合的方式使用是符合面向对象设计的。
2. 会输出:
I am ChildClass's f().
I am ChildClass's f().
调用demo.overloadFunction(p);时,会根据重载特性调用函数
public void overloadFunction(ParentClass p)
{
p.f();
}
运行时,因为p是ChildClass对象,所以会根据多态特性使用ChildClass的f函数。
2
3
4
5
6
7
8
9
10
11
1.争哥在前面讲面向对象的设计原则时就已经解答了这个问题,不要太死板的遵守各种设置原则,定义,只要写出来的代码是可扩展、可读性、可复用的代码就是好代码。
2.代码执行结果
I am ChildClass's f().
I am ChildClass's f().
虽然执行重载方法时是根据参数的编译时类型,但是调用哪个对象的方法是根据对象的运行时类型来决定的,所以最终调用的还是实际类型的f()方法。
2
3
4
5
关于访问者模式的替代方式,我的看法:
先放总结: 行为不可抽象+水平扩展较多-->工厂模式更合适
行为可抽象+垂直扩展较多-->模板方法模式更合适
我认为模板方法模式和工厂模式都可以,具体使用哪种,应该根据扩展的方向来确认:
当前的场景是对不同文件格式的文本进行处理,目前有word,ppt与pdf三种格式,他们的行为都不一致,比如word的抽取,分析与pdf的抽取,分析行为不一致,而且扩展的方向是添加不同的文件格式,比如txt格式,excel等格式,那么最好的方式就是采用工厂模式,每次添加新格式需要添加新的工厂,实现相应的方法
如果扩展的方向是给不同文件格式添加更多的功能,同时这些行为可以抽象出来,比如当前有抽取,分析,压缩等功能,他们有很大一部分可以抽象到父类,那么我要给所有的文件格式添加敏感词替换,格式化文本等功能,就可以将它们添加到父类,而不用每个工厂都加一遍,这种情况模板方法模式更合适
2
3
4
5
6
两次结果 都是 I am ChildClass's f().
demo.polymorphismFunction(p) // 执行哪个对象的方法,由对象的实际类型决定, p的实际类型是 ChildClass,
demo.overloadFunction(p) , // 执行对象的哪个方法,由声明类型决定,p的声明类型是ParentClass,因此 匹配重载版本overloadFunction(ParentClass p), 但此函数内部调用的p.f(),符合执行哪个对象的方法,由实际类型决定,也就是多态,因此调用的是ClidClass.f()
2
3
4
设计模式_69: 访问者模式(下)
# 作业:
1. 抛开业务,单向依赖变成双向依赖,确实增加了依赖上的耦合程度。但从业务上讲,它这么做解耦了行为和对象的依赖,符合了开闭原则等另外一些原则,算是一种取舍吧。
2. 结果:输出`"I am ChildClass's f()."`,原因: 多态 ==> 单分派 ==> 运行哪个对象的方法取决于对象的运行时类型。
# 感想
从上节内容看来,感觉访问者模式就是一种因不支持 `Double Dispatch` 特性而诞生的模式,那么Java为什么不支持`Single Dispatch`呢?看到一些答案说是性能,感觉不是很有说服力。
2
3
4
5
6
实际上操作与对象并没有分开吧,访问者accpect方法其实就是操作了,只不过将操作部分抽象出来了,组合到对象里而已
打卡 今日学习访问者模式下,收获如下:
访问者模式实现比较难于理解,主要要理解静态分派和动态分派。通过本专栏的内容学习到了双分派和单分派。自己使用的主要语言Java是单分派。单分派就是指的是执行哪个对象的方法,根据对象的运行时类型来决定;执行对象的哪个方法,根据方法参数的编译时类型来决定。
理解分派之前需要理解变量是有静态类型和实际类型的,如 A a = new B(), 变量a的静态类型(声明类型)是A,实际类型是B。如果是 A a = new A(),那么变量a的静态类型和实际类型都是A。方法调用过程中判断是用父类对象还是子类对象其实就是多态,运行时根据变量的实际类型来决定是使用子类对象中的方法还是父类对象中的方法。其中涉及到invokevirtaul字节码多态查找流程,简单的理解就是先在已确定对象中寻找方法(如子类),如果找不到往父类中找,如果一直找不到就抛出异常。在确定调用对象后(如确定是子类对象)在调用方法时可能存在方法的重载,这时候就涉及到静态分派(静态绑定),根据变量的静态类型(声明类型)来判断方法的调用版本。
课后思考:
1. 访问者模式将操作与对象分离,是否违背面向对象设计原则?你怎么看待这个问题呢?对于这个问题,我觉得不能死套设计原则,对于业务场景,要有所取舍。就像专栏中的这个例子,如果所有的功能都写在了相关类中,随着需求不断的迭代,类会变膨胀,可维护性、可读性、可测试性都会变差,后期维护成本会变高。如果一开始就能确定需求不会变化,就只有这么两类操作,那么可以不用访问者这么模式,直接写在相关类中。
2. DemoMain 的输出结果会是什么呢? ChildClass 类中的f()方法会被调用两次。首先根据方法重载是静态绑定,会调用形参是ParentClass的overloadFunction方法,在该方法中“p.f();” 变量“p”的静态类型是
ParentClass,而实际类型却是ChildClass。根据多态的动态绑定,在ChildClass类中复写了父类中的f()方法,因此,这里会调用ChildClass中的f();
2
3
4
5
6
7
为啥用C#写完课后题两次输出的都是ParentClass
在该场景中,对对象的操作属于外部对其的处理行为,不应该放在对象内部,否则对象会爆炸。导致职责过多不清晰,很可能成为上帝类。
1.其实没有什么违背,我们这样做,其实操作和对象本身还是挂着勾的,只是将两者操作简单的剥离了出去,就好比Service层的service类和Domain类一样,而且提高了代码的可维护,可扩展性
2.皆为C,而非P,改为上面的方法后,虽然找到了overloadFunction(P p),但是又变为了执行哪个对象的方法的问题了,所以还是C
2
"执行哪个对象的方法,由对象的实际类型决定; 执行对象的哪个方法,由参数对象的声明类型决定" 这两句话得仔细琢磨
1. 对象(pdf,word,txt)本身应该没有压缩、提取内容等能力,所以这些能力不能算在这个对象身上
2. 我理解输出都是:I am ChildClass's f().
虽然第二个调的是public void overloadFunction(ParentClass p) ,但p.f(),实际上是由p的实际对象决定的。
2
3