Python中的异常处理是如何实现的?
这个问题要求解释如何在各种语言中实现异常处理,但它没有收到任何 Python 响应。
我对 Python 特别感兴趣,因为 Python 以某种方式“鼓励”通过EAFP 原理抛出和捕获异常。
我从其他 SO 答案中了解到,如果预计很少引发异常,try/catch 块比 if/else 语句便宜,并且调用深度很重要,因为填充堆栈跟踪很昂贵。这可能主要适用于所有编程语言。
但是,python 的特别之处在于 EAFP 原则的高优先级。因此,python 异常是如何在参考实现 (CPython) 中内部实现的?
回答
try ... except编译器中有一些不错的文档:
/*
Code generated for "try: S except E1 as V1: S1 except E2 as V2: S2 ...":
(The contents of the value stack is shown in [], with the top
at the right; 'tb' is trace-back info, 'val' the exception's
associated value, and 'exc' the exception.)
Value stack Label Instruction Argument
[] SETUP_FINALLY L1
[] <code for S>
[] POP_BLOCK
[] JUMP_FORWARD L0
[tb, val, exc] L1: DUP )
[tb, val, exc, exc] <evaluate E1> )
[tb, val, exc, exc, E1] JUMP_IF_NOT_EXC_MATCH L2 ) only if E1
[tb, val, exc] POP
[tb, val] <assign to V1> (or POP if no V1)
[tb] POP
[] <code for S1>
JUMP_FORWARD L0
[tb, val, exc] L2: DUP
.............................etc.......................
[tb, val, exc] Ln+1: RERAISE # re-raise exception
[] L0: <next statement>
Of course, parts are not generated if Vi or Ei is not present.
*/
static int
compiler_try_except(struct compiler *c, stmt_ty s)
{
我们有:
- 一条
SETUP_FINALLY指令,可能会注册L1为发生异常时跳转到的位置(从技术上讲,我猜它会将其压入堆栈,因为在我们的块完成时必须恢复先前的值)。 - 的代码
S,即try:块内的代码。 - 一条
POP_BLOCK清除内容的指令(仅在 OK 情况下达到;我猜如果有异常,VM 会自动执行) - a
JUMP_FORWARD到L0,即下一条指令的位置(try ... except块外)
这就是我们将在 OK 情况下运行的所有字节码。请注意,字节码不需要主动检查异常。相反,虚拟机会L1在出现异常的情况下自动跳转。这是在执行 RAISE_VARARGS 时在ceval.c 中完成的。
那么会发生什么L1?简单地说,我们except按顺序检查每个子句:它是否与当前引发的异常匹配?如果是,我们运行该except块中的代码并跳转到L0(try ... except块外的第一条指令)。如果不是,我们检查下一个except子句,或者如果没有子句匹配,则重新引发异常。
但让我们更具体一点。该dis模块让我们转储字节码。所以让我们创建两个小的 python 文件。
一种检查:
tmp$ cat if.py
if type(x) is int:
x += 1
else:
print('uh-oh')
...还有一个:
tmp$ cat try.py
try:
x += 1
except TypeError as e:
print('uh-oh')
现在,让我们转储他们的字节码:
tmp$ python3 -m dis if.py
1 0 LOAD_NAME 0 (type)
2 LOAD_NAME 1 (x)
4 CALL_FUNCTION 1
6 LOAD_NAME 2 (int)
8 COMPARE_OP 8 (is)
10 POP_JUMP_IF_FALSE 22
2 12 LOAD_NAME 1 (x)
14 LOAD_CONST 0 (1)
16 INPLACE_ADD
18 STORE_NAME 1 (x)
20 JUMP_FORWARD 8 (to 30)
4 >> 22 LOAD_NAME 3 (print)
24 LOAD_CONST 1 ('uh-oh')
26 CALL_FUNCTION 1
28 POP_TOP
>> 30 LOAD_CONST 2 (None)
32 RETURN_VALUE
对于成功的案例,这将运行 13 条指令(从 0 到 20,然后是 30 和 32)。
tmp$ python3 -m dis try.py
1 0 SETUP_EXCEPT 12 (to 14)
2 2 LOAD_NAME 0 (x)
4 LOAD_CONST 0 (1)
6 INPLACE_ADD
8 STORE_NAME 0 (x)
10 POP_BLOCK
12 JUMP_FORWARD 42 (to 56)
3 >> 14 DUP_TOP
16 LOAD_NAME 1 (TypeError)
18 COMPARE_OP 10 (exception match)
20 POP_JUMP_IF_FALSE 54
22 POP_TOP
24 STORE_NAME 2 (e)
26 POP_TOP
28 SETUP_FINALLY 14 (to 44)
4 30 LOAD_NAME 3 (print)
32 LOAD_CONST 1 ('uh-oh')
34 CALL_FUNCTION 1
36 POP_TOP
38 POP_BLOCK
40 POP_EXCEPT
42 LOAD_CONST 2 (None)
>> 44 LOAD_CONST 2 (None)
46 STORE_NAME 2 (e)
48 DELETE_NAME 2 (e)
50 END_FINALLY
52 JUMP_FORWARD 2 (to 56)
>> 54 END_FINALLY
>> 56 LOAD_CONST 2 (None)
58 RETURN_VALUE
对于成功的案例,这将运行 9 条指令(包括 0-12,然后是 56 和 58)。
现在,指令计数远不是所用时间的完美衡量标准(尤其是在字节码 vm 中,指令的成本可能差异很大),但确实如此。
最后,让我们看看 CPython 如何“自动”跳转到L1. 正如我之前写的,它是作为执行的RAISE_VARARGS一部分发生的:
case TARGET(RAISE_VARARGS): {
PyObject *cause = NULL, *exc = NULL;
switch (oparg) {
case 2:
cause = POP(); /* cause */
/* fall through */
case 1:
exc = POP(); /* exc */
/* fall through */
case 0:
if (do_raise(tstate, exc, cause)) {
goto exception_unwind;
}
break;
default:
_PyErr_SetString(tstate, PyExc_SystemError,
"bad RAISE_VARARGS oparg");
break;
}
goto error;
}
[...]
exception_unwind:
f->f_state = FRAME_UNWINDING;
/* Unwind stacks if an exception occurred */
while (f->f_iblock > 0) {
/* Pop the current block. */
PyTryBlock *b = &f->f_blockstack[--f->f_iblock];
if (b->b_type == EXCEPT_HANDLER) {
UNWIND_EXCEPT_HANDLER(b);
continue;
}
UNWIND_BLOCK(b);
if (b->b_type == SETUP_FINALLY) {
PyObject *exc, *val, *tb;
int handler = b->b_handler;
_PyErr_StackItem *exc_info = tstate->exc_info;
/* Beware, this invalidates all b->b_* fields */
PyFrame_BlockSetup(f, EXCEPT_HANDLER, f->f_lasti, STACK_LEVEL());
PUSH(exc_info->exc_traceback);
PUSH(exc_info->exc_value);
if (exc_info->exc_type != NULL) {
PUSH(exc_info->exc_type);
}
else {
Py_INCREF(Py_None);
PUSH(Py_None);
}
_PyErr_Fetch(tstate, &exc, &val, &tb);
/* Make the raw exception data
available to the handler,
so a program can emulate the
Python main loop. */
_PyErr_NormalizeException(tstate, &exc, &val, &tb);
if (tb != NULL)
PyException_SetTraceback(val, tb);
else
PyException_SetTraceback(val, Py_None);
Py_INCREF(exc);
exc_info->exc_type = exc;
Py_INCREF(val);
exc_info->exc_value = val;
exc_info->exc_traceback = tb;
if (tb == NULL)
tb = Py_None;
Py_INCREF(tb);
PUSH(tb);
PUSH(val);
PUSH(exc);
JUMPTO(handler);
if (_Py_TracingPossible(ceval2)) {
trace_info.instr_prev = INT_MAX;
}
/* Resume normal execution */
f->f_state = FRAME_EXECUTING;
goto main_loop;
}
} /* unwind stack */
有趣的部分是JUMPTO(handler)线路。该handler值来自b->b_handler,而该值又由SETUP_FINALLY指令设置。有了这个,我想我们已经回到了原点!哇!