当前位置: 代码迷 >> 综合 >> Fluent Python - Part12 继承的优缺点
  详细解决方案

Fluent Python - Part12 继承的优缺点

热度:17   发布时间:2023-10-21 05:19:45.0

本章主要讨论两个内容:

  • 子类化内置类型的缺点
  • 多重继承和方法解析顺序

子类化内置类型很麻烦

在 Python2.2 之前,内置类型(如list 或 dict) 不能子类化。在 Python2.2 之后,内置类型可以子类化了,但是有个重要的注意事项:内置类型(使用C语言编写)不会调用用户定义的类覆盖的特殊方法。

至于内置类型的子类覆盖的方法会不会隐式调用,CPython 没有指定官方规则。基本上,内置类型的方法不会调用子类覆盖的方法。例如,dict 的子类覆盖的 __getitem__() 方法不会被内置类型的 get() 方法调用。

class DoppeDict(dict):def __setitem__(self, key, value):super().__setitem__(key, [value] * 2)dd = DoppeDict(one=1)
print(dd)
dd['two'] = 2
print(dd)
dd.update(three=3)
print(dd)
""" output {'one': 1} {'one': 1, 'two': [2, 2]} {'one': 1, 'two': [2, 2], 'three': 3} """

原生类型的这种行为违背了面向对象编程的一个基本原则:始终应该从实例(self)所属的类开始搜索方法,即使在超类实现的类中调用也是如此。在这种糟糕的局面中, __missing__ 方法却能按预期方式工作,不过这只是特例。

直接子类化内置类型(如dict, list 或 str) 容易出错,因为内置类型的方法通常会忽略用户覆盖的方法。不要子类化内置类型,用户自己定义的类应该继承collections 模块中的类,例如 UserDict, UserList, UserString, 这些类做了特殊设计,因此易于扩展。

import collectionsclass DoppeDict2(collections.UserDict):def __setitem__(self, key, value):super().__setitem__(key, [value] * 2)dd = DoppeDict2(one=1)
print(dd)
dd['two'] = 2
print(dd)
dd.update(three=3)
print(dd)class AnswerDict2(collections.UserDict):def __getitem__(self, key):return 42ad = AnswerDict2(a='foo')
print(ad['a'])
d = {
    }
d.update(ad)
print(d['a'])
print(d)
""" output: {'one': [1, 1]} {'one': [1, 1], 'two': [2, 2]} {'one': [1, 1], 'two': [2, 2], 'three': [3, 3]} 42 42 {'a': 42} """

多重继承和方法解析顺序

任何实现多重继承的语言都要处理潜在的命名冲突,这种冲突由不相关的祖先类实现同名方法引起。这种冲突称为“菱形问题”
Fluent Python - Part12 继承的优缺点

(左) 说明”菱形问题“的 UML 类图;(又) 虚线箭头是下例使用的方法解析顺序

class A:def ping(self):print('ping:', self)class B(A):def pong(self):print("pong", self)class C(A):def pong(self):print("PONG", self)class D(B, C):def ping(self):super().ping()print("post-ping", self)def pingpong(self):self.ping()super().ping()self.pong()super().pong()C.pong(self)d = D()
d.pong()
C.pong(d)
""" output: pong <__main__.D object at 0x10cf14790> PONG <__main__.D object at 0x10cf14790> """

Python 能区分 d.pong() 调用的是哪个方法,是因为 Python 会按照特定的顺序遍历继承图。这个顺序叫方法解析顺序(Method Resolution Order, MRO)。类都有一个名为 __mro__ 属性,它的值是一个元祖,按照方法解析顺序列出各个超类,从当前类一直向上,直到 object 类, D 类的 __mro__ 属性如下:

print(D.__mro__)
(<class '__main__.D'>, <class '__main__.B'>, <class '__main__.C'>, <class '__main__.A'>, <class 'object'>)
  • tips:方法解析顺序使用 C3算法计算。Michele Simionato 的论文 ”The Python 2.3 Method Resolution Order“(https://www.python.org/download/releases/2.3/mro/) 对 Python 方法解析顺序使用的 C3算法做了权威论述。

处理多重继承

如 Alan Kay 所言,继承有很多用途,而多重继承增加了可选方案和复杂度。使用多重继承容易得出令人费解和脆弱的设计。我们还没有完整的理论,下面是避免把类图搅乱的一些建议。

  1. 把接口继承和实现继承区分开
    使用多重继承时,一定要明确一开始为什么创建子类。主要原因可能有:

    • 继承接口,创建子类型,实现”是什么“关系
    • 继承实现,通过重用避免代码重复

    其实这两条经常同时出现,不过只要可能,一定要明确意图。通过继承重用代码是实现细节,通常可以换用组合和委托模式。而接口继承则是框架的支柱。

  2. 使用抽象基类显式表示接口
    现代的 Python 中,如果类的作用是定义接口,应该明确把它定义为抽象基类。Python3.4及以上的版本中,我们要创建 abc.ABC 或其他抽象基类的子类。

  3. 通过混入重用代码
    如果一个类的作用是为多个不相关的子类提供方法实现,从而实现重用,但不体现”是什么“关系,应该把那个类明确地定义为混入类(mixin class)。从概念上讲,混入不定义新类型,只是打包方法,便于重用。混入类绝对不能实例化,而且具体类不能只继承混入类。混入类应该提供某方面的特定行为,只实现少量关系非常紧密的方法。

  4. 在名称中明确指明混入
    因为在 Python 中没有把类声明为混入的正规方式,所以强烈推荐在名称中假如…Mixin 后缀。

  5. 抽象基类可以作为混入,反过来则不成立
    抽象基类可以实现具体方法,因此也可以作为混入使用。不过,抽象基类会定义类型,而混入做不到。此外,抽象基类可以作为其他类的唯一基类,而混入决不能作为唯一的超类,除非继承另一个更具体的混入—真实的代码很少这样做。

    抽象基类有个局限是混入没有的:抽象基类中实现的具体方法只能与抽象基类及其超类中的方法协作。这表明,抽象基类中具体方法只是一种便利措施,因为这些方法所做的一切,用户调用抽象基类中的其他方法也能做到。

  6. 不要子类化多个具体类
    具体类可以没有,或最多只有一个具体超类。也就是说,具体类的超类中除了这一个具体超类之外,其余的都是抽象基类或混入。例如,在下述代码中,如果 Alpha 是具体类,那么 Beta 和 Gamma 必须是抽象基类或混入:

    class MyConcreteClass(Alpha, Beta, Gamma):
    """这是一个具体类,可以实例化"""
    
  7. 为用户提供聚合类
    如果抽象基类或混入的组合对客户代码非常有用,那就提供一个类,使用易于理解的方式把他们结合起来。

  8. 优先使用对象组合,而不是类继承
    组合和委托可以代替混入,把行为提供给不同的类,但是不能取代接口继承去定义类型层次结构。