Python中的异常处理是如何实现的?

这个问题要求解释如何在各种语言中实现异常处理,但它没有收到任何 Python 响应。

我对 Python 特别感兴趣,因为 Python 以某种方式“鼓励”通过EAFP 原理抛出和捕获异常。

我从其他 SO 答案中了解到,如果预计很少引发异常,try/catch 块比 if/else 语句便宜,并且调用深度很重要,因为填充堆栈跟踪很昂贵。这可能主要适用于所有编程语言。

但是,python 的特别之处在于 EAFP 原则的高优先级。因此,python 异常是如何在参考实现 (CPython) 中内部实现的?

回答

try ... except编译器中有一些不错的文档:

/*
   Code generated for "try: S except E1 as V1: S1 except E2 as V2: S2 ...":
   (The contents of the value stack is shown in [], with the top
   at the right; 'tb' is trace-back info, 'val' the exception's
   associated value, and 'exc' the exception.)
   Value stack          Label   Instruction     Argument
   []                           SETUP_FINALLY   L1
   []                           <code for S>
   []                           POP_BLOCK
   []                           JUMP_FORWARD    L0
   [tb, val, exc]       L1:     DUP                             )
   [tb, val, exc, exc]          <evaluate E1>                   )
   [tb, val, exc, exc, E1]      JUMP_IF_NOT_EXC_MATCH L2        ) only if E1
   [tb, val, exc]               POP
   [tb, val]                    <assign to V1>  (or POP if no V1)
   [tb]                         POP
   []                           <code for S1>
                                JUMP_FORWARD    L0
   [tb, val, exc]       L2:     DUP
   .............................etc.......................
   [tb, val, exc]       Ln+1:   RERAISE     # re-raise exception
   []                   L0:     <next statement>
   Of course, parts are not generated if Vi or Ei is not present.
*/
static int
compiler_try_except(struct compiler *c, stmt_ty s)
{

我们有:

  • 一条SETUP_FINALLY指令,可能会注册L1为发生异常时跳转到的位置(从技术上讲,我猜它会将其压入堆栈,因为在我们的块完成时必须恢复先前的值)。
  • 的代码S,即try:块内的代码。
  • 一条POP_BLOCK清除内容的指令(仅在 OK 情况下达到;我猜如果有异常,VM 会自动执行)
  • aJUMP_FORWARD到L0,即下一条指令的位置(try ... except块外)

这就是我们将在 OK 情况下运行的所有字节码。请注意,字节码不需要主动检查异常。相反,虚拟机会L1在出现异常的情况下自动跳转。这是在执行 RAISE_VARARGS 时在ceval.c 中完成的。

那么会发生什么L1?简单地说,我们except按顺序检查每个子句:它是否与当前引发的异常匹配?如果是,我们运行该except块中的代码并跳转到L0try ... except块外的第一条指令)。如果不是,我们检查下一个except子句,或者如果没有子句匹配,则重新引发异常。

但让我们更具体一点。该dis模块让我们转储字节码。所以让我们创建两个小的 python 文件。

一种检查:

tmp$ cat if.py
if type(x) is int:
    x += 1
else:
    print('uh-oh')

...还有一个:

tmp$ cat try.py
try:
    x += 1
except TypeError as e:
    print('uh-oh')

现在,让我们转储他们的字节码:

tmp$ python3 -m dis if.py
  1           0 LOAD_NAME                0 (type)
              2 LOAD_NAME                1 (x)
              4 CALL_FUNCTION            1
              6 LOAD_NAME                2 (int)
              8 COMPARE_OP               8 (is)
             10 POP_JUMP_IF_FALSE       22

  2          12 LOAD_NAME                1 (x)
             14 LOAD_CONST               0 (1)
             16 INPLACE_ADD
             18 STORE_NAME               1 (x)
             20 JUMP_FORWARD             8 (to 30)

  4     >>   22 LOAD_NAME                3 (print)
             24 LOAD_CONST               1 ('uh-oh')
             26 CALL_FUNCTION            1
             28 POP_TOP
        >>   30 LOAD_CONST               2 (None)
             32 RETURN_VALUE

对于成功的案例,这将运行 13 条指令(从 0 到 20,然后是 30 和 32)。

tmp$ python3 -m dis try.py 
  1           0 SETUP_EXCEPT            12 (to 14)

  2           2 LOAD_NAME                0 (x)
              4 LOAD_CONST               0 (1)
              6 INPLACE_ADD
              8 STORE_NAME               0 (x)
             10 POP_BLOCK
             12 JUMP_FORWARD            42 (to 56)

  3     >>   14 DUP_TOP
             16 LOAD_NAME                1 (TypeError)
             18 COMPARE_OP              10 (exception match)
             20 POP_JUMP_IF_FALSE       54
             22 POP_TOP
             24 STORE_NAME               2 (e)
             26 POP_TOP
             28 SETUP_FINALLY           14 (to 44)

  4          30 LOAD_NAME                3 (print)
             32 LOAD_CONST               1 ('uh-oh')
             34 CALL_FUNCTION            1
             36 POP_TOP
             38 POP_BLOCK
             40 POP_EXCEPT
             42 LOAD_CONST               2 (None)
        >>   44 LOAD_CONST               2 (None)
             46 STORE_NAME               2 (e)
             48 DELETE_NAME              2 (e)
             50 END_FINALLY
             52 JUMP_FORWARD             2 (to 56)
        >>   54 END_FINALLY
        >>   56 LOAD_CONST               2 (None)
             58 RETURN_VALUE

对于成功的案例,这将运行 9 条指令(包括 0-12,然​​后是 56 和 58)。

现在,指令计数远不是所用时间的完美衡量标准(尤其是在字节码 vm 中,指令的成本可能差异很大),但确实如此。

最后,让我们看看 CPython 如何“自动”跳转到L1. 正如我之前写的,它是作为执行的RAISE_VARARGS一部分发生的:

    case TARGET(RAISE_VARARGS): {
        PyObject *cause = NULL, *exc = NULL;
        switch (oparg) {
        case 2:
            cause = POP(); /* cause */
            /* fall through */
        case 1:
            exc = POP(); /* exc */
            /* fall through */
        case 0:
            if (do_raise(tstate, exc, cause)) {
                goto exception_unwind;
            }
            break;
        default:
            _PyErr_SetString(tstate, PyExc_SystemError,
                             "bad RAISE_VARARGS oparg");
            break;
        }
        goto error;
    }

[...]

exception_unwind:
    f->f_state = FRAME_UNWINDING;
    /* Unwind stacks if an exception occurred */
    while (f->f_iblock > 0) {
        /* Pop the current block. */
        PyTryBlock *b = &f->f_blockstack[--f->f_iblock];

        if (b->b_type == EXCEPT_HANDLER) {
            UNWIND_EXCEPT_HANDLER(b);
            continue;
        }
        UNWIND_BLOCK(b);
        if (b->b_type == SETUP_FINALLY) {
            PyObject *exc, *val, *tb;
            int handler = b->b_handler;
            _PyErr_StackItem *exc_info = tstate->exc_info;
            /* Beware, this invalidates all b->b_* fields */
            PyFrame_BlockSetup(f, EXCEPT_HANDLER, f->f_lasti, STACK_LEVEL());
            PUSH(exc_info->exc_traceback);
            PUSH(exc_info->exc_value);
            if (exc_info->exc_type != NULL) {
                PUSH(exc_info->exc_type);
            }
            else {
                Py_INCREF(Py_None);
                PUSH(Py_None);
            }
            _PyErr_Fetch(tstate, &exc, &val, &tb);
            /* Make the raw exception data
               available to the handler,
               so a program can emulate the
               Python main loop. */
            _PyErr_NormalizeException(tstate, &exc, &val, &tb);
            if (tb != NULL)
                PyException_SetTraceback(val, tb);
            else
                PyException_SetTraceback(val, Py_None);
            Py_INCREF(exc);
            exc_info->exc_type = exc;
            Py_INCREF(val);
            exc_info->exc_value = val;
            exc_info->exc_traceback = tb;
            if (tb == NULL)
                tb = Py_None;
            Py_INCREF(tb);
            PUSH(tb);
            PUSH(val);
            PUSH(exc);
            JUMPTO(handler);
            if (_Py_TracingPossible(ceval2)) {
                trace_info.instr_prev = INT_MAX;
            }
            /* Resume normal execution */
            f->f_state = FRAME_EXECUTING;
            goto main_loop;
        }
    } /* unwind stack */

有趣的部分是JUMPTO(handler)线路。该handler值来自b->b_handler,而该值又由SETUP_FINALLY指令设置。有了这个,我想我们已经回到了原点!哇!


以上是Python中的异常处理是如何实现的?的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>