CMD管道与Powershell管道不同?
我正在尝试将 Node.js 输出通过管道传输到 preatty-pino
node .distGameNode.js | pino-pretty
在 CMD 中运行它我得到了我的格式化输出但是在 powershell 中运行它我什么也得不到。我读到 Powershell 在管道时正在使用对象,所以我试过了
node .distGameNode.js | Out-String -Stream | pino-pretty
但这也行不通。
为什么它可以在 CMD 中工作,而不能在 Powershell 中工作?谢谢 :)
回答
注意:pino-pretty问题中描述的具体问题无法通过以下信息解决。Lukas(OP)已在此处提交错误报告。
令人惊讶的是你什么也没得到,但根本的区别是:
-
cmd.exe的管道处理原始数据,即字节流(接收数据的给定程序本身可能会或可能不会解释为文本)。 -
PowerShell 的管道,在与外部程序对话时,只传输文本(字符串),这有两个含义:
-
在将数据传送到外部程序时,必须对文本进行编码,这基于存储在首选项变量中
$OutputEncoding的字符编码。 -
从外部程序接收数据时,必须对数据进行解码,这基于存储在 中的字符编码
[Console]::OutputEncoding,默认情况下是系统的 OEM 代码页,如 中所反映chcp。-
无论数据是在 PowerShell 中进一步处理还是传递到另一个外部程序,这种解码总是会发生。
- 在这个答案中讨论了即使在两个外部程序之间也无法通过 PowerShell 的管道发送原始数据的问题,有时会出现问题。
-
唯一的例外是如果外部程序输出既没有被捕获,也没有通过管道发送,也没有重定向到文件:在这种情况下,数据直接打印到控制台(终端),但只在本地控制台中(使用 PowerShell 时)远程与远程机器交互,解码总是再次涉及)。
- 这种直接显示的打印有时会隐藏编码问题,因为某些程序,特别是在这种情况下,会在特定情况下
python使用完整的 Unicode 支持;也就是说,输出可能打印得很好,但是当您尝试进一步处理它时,可能会出现编码问题。 - 强制解码的一种简单方法是将调用括在
(...); 例如,
python -c "print('eé')"打印正常,但
(python -c "print('eé'))"出现编码问题;有关更多信息,请参阅底部
- 这种直接显示的打印有时会隐藏编码问题,因为某些程序,特别是在这种情况下,会在特定情况下
-
-
虽然控制台应用程序传统上使用活动 OEM 代码页进行字符编码和解码,但Node.js 始终使用 UTF-8。
因此,为了使 PowerShell 与 Node.js 程序正常通信,您必须(暂时)首先设置以下内容:
$OutputEncoding = [Console]::OutputEncoding = [System.Text.UTF8Encoding]::new()
如果您想从根本上切换到 UTF-8,无论是系统范围的(具有深远的影响)还是仅用于 PowerShell 控制台窗口,请参阅此答案。
Out-String -Stream顺便说一句:中继外部程序的输出永远不需要中间管道段 - 它是有效的(昂贵的)无操作,因为逐行流式传输 stdout 输出是 PowerShell 默认情况下所做的。换句话说:它对您的情况没有影响也就不足为奇了。
可选阅读:方便功能Invoke-WithEncoding和诊断功能,Debug-NativeInOutput用于临时编码需求/诊断:
如果无法将所有 PowerShell 控制台切换到 UTF-8 和/或您需要处理使用 UTF-8 或活动 OEM 代码页以外的特定编码的“流氓”程序,您可以安装:
- Function
Invoke-WithEncoding,它在调用外部程序时临时切换到给定的编码,直接从这个 Gist如下(我可以向你保证这样做是安全的,但你应该总是检查):
# Download and define advanced function Invoke-WithEncoding in the current session.
irm https://gist.github.com/mklement0/ef57aea441ea8bd43387a7d7edfc6c19/raw/Invoke-WithEncoding.ps1 | iex
- Function
Debug-NativeInOutput,它有助于诊断外部程序的编码问题,直接从这个 Gist如下(同样,你应该先检查):
# Download and define advanced function Debug-NativeInOutput in the current session.
irm https://gist.github.com/mklement0/eac1f18fbe0fc2798b214229b747e5dd/raw/Debug-NativeInOutput.ps1 | iex
下面是使用命令打印重音字符的示例命令python。
与 Node.js 一样,Python 的行为是非标准的,虽然它不使用 UTF-8,但使用系统的活动ANSI (!) 代码页(而不是预期的OEM代码页)。
也就是说,即使您将 PowerShell 控制台切换为 UTF-8,默认情况下与 Python 脚本的通信也无法正常工作,除非做出额外的努力,这Invoke-WithEncoding可以为您封装:
注意:我在这里使用 Python 作为示例,以说明函数的工作原理。它是能够使Python使用UTF-8,即由任一设置环境变量PYTHONUTF8到1或-在V3.7 + -通过使参数-X utf8(区分完全一致)。
Invoke-WithEncoding 例子:
# Outputs *already-decoded* output, so if the output *prints* fine,
# then *decoding* worked fine too.
PS> Invoke-WithEncoding { python -c "print('eé')" } -Encoding Ansi -WindowsOnly
eé
-
请注意,
Invoke-WithEncoding确保对 .NET 字符串的实际解码发生在它输出之前,以便编码问题不会被 Windows 上看似正确的直接显示输出意外掩盖(更多信息见下文)。 -
-WindowsOnly用于跨平台兼容性并确保在这种情况下编码仅适用于 Windows(在 Unix 上,Python 使用 UTF-8)。
Debug-NativeInOutput 例子:
使用默认的 PowerShell 控制台,使用系统的 OEM 代码页,您将看到以下输出,使用相同的 Python 命令,从 PowerShell (Core) 7.1 调用:
PS> Debug-NativeInOutput { python -c "print('eé')" }
-
需要注意的
DecodedOutput财产,显示错误-decoded结果基于解释Python的作为输出OEM -而不是ANSI编码:'e?'。(Input*属性为空,因为该命令不涉及到Python 脚本的管道数据。) -
相比之下,通过直接显示打印,输出打印得很好(因为 Python 那时 - 并且只有那时 - 使用 Unicode),这隐藏了问题,但是一旦您想以编程方式处理输出 - 在变量中捕获,发送到管道中的另一个命令,重定向到文件 - 编码问题将浮出水面。
-
像
Invoke-WithEncoding,Debug-NativeInOutput支持一个-Encoding参数,所以如果你传递-Encoding Ansi给上面的调用,你会看到 Python 的输出被正确解码。 -
输出反映了这样一个事实:在 PowerShell (Core) 中,
$OutputEncoding默认为 UTF-8,而在 Windows PowerShell 中,它默认为 ASCII(!)。这种与实际编码的不匹配是有问题的,GitHub issue # 上的这个评论提出了一种在未来解决这个问题的方法(仅适用于 PowerShell (Core))。