CMD管道与Powershell管道不同?

我正在尝试将 Node.js 输出通过管道传输到 preatty-pino

node .distGameNode.js | pino-pretty

在 CMD 中运行它我得到了我的格式化输出但是在 powershell 中运行它我什么也得不到。我读到 Powershell 在管道时正在使用对象,所以我试过了

node .distGameNode.js | Out-String -Stream | pino-pretty

但这也行不通。

为什么它可以在 CMD 中工作,而不能在 Powershell 中工作?谢谢 :)

回答

注意:pino-pretty问题中描述的具体问题无法通过以下信息解决。Lukas(OP)已在此处提交错误报告。

令人惊讶的是你什么也没得到,但根本的区别是:

  • cmd.exe的管道处理原始数据,即字节流(接收数据的给定程序本身可能会或可能不会解释为文本)。

  • PowerShell 的管道,在与外部程序对话时,传输文本(字符串),这有两个含义:

    • 在将数据传送到外部程序时,必须对文本进行编码,这基于存储在首选项变量中$OutputEncoding的字符编码。

    • 外部程序接收数据时,必须对数据进行解码,这基于存储在 中的字符编码[Console]::OutputEncoding,默认情况下是系统的 OEM 代码页,如 中所反映chcp

      • 无论数据是在 PowerShell 中进一步处理还是传递到另一个外部程序这种解码总是会发生

        • 在这个答案中讨论了即使在两个外部程序之间无法通过 PowerShell 的管道发送原始数据的问题有时会出现问题。
      • 唯一的例外是如果外部程序输出既没有被捕获,也没有通过管道发送,也没有重定向到文件:在这种情况下,数据直接打印到控制台(终端),但只在本地控制台中(使用 PowerShell 时)远程与远程机器交互,解码总是再次涉及)。

        • 这种直接显示的打印有时会隐藏编码问题,因为某些程序,特别是在这种情况下,会在特定情况下python使用完整的 Unicode 支持;也就是说,输出可能打印得很好,但是当您尝试进一步处理它时,可能会出现编码问题。
        • 强制解码的一种简单方法将调用括在(...); 例如,
          python -c "print('eé')" 打印正常,但
          (python -c "print('eé'))"出现编码问题;有关更多信息,请参阅底部

虽然控制台应用程序传统上使用活动 OEM 代码页进行字符编码和解码,但Node.js 始终使用 UTF-8

因此,为了使 PowerShell 与 Node.js 程序正常通信,您必须(暂时)首先设置以下内容:

$OutputEncoding = [Console]::OutputEncoding = [System.Text.UTF8Encoding]::new()

如果您想从根本上切换到 UTF-8,无论是系统范围的(具有深远的影响)还是仅用于 PowerShell 控制台窗口,请参阅此答案。


Out-String -Stream顺便说一句:中继外部程序的输出永远不需要中间管道段 - 它是有效的(昂贵的)无操作,因为逐行流式传输 stdout 输出是 PowerShell 默认情况下所做的。换句话说:它对您的情况没有影响也就不足为奇了。


可选阅读:方便功能Invoke-WithEncoding和诊断功能,Debug-NativeInOutput用于临时编码需求/诊断:

如果无法将所有 PowerShell 控制台切换到 UTF-8 和/或您需要处理使用 UTF-8 或活动 OEM 代码页以外的特定编码的“流氓”程序,您可以安装:

  • Function Invoke-WithEncoding,它在调用外部程序时临时切换到给定的编码,直接从这个 Gist如下(我可以向你保证这样做是安全的,但你应该总是检查):
# Download and define advanced function Invoke-WithEncoding in the current session.
irm https://gist.github.com/mklement0/ef57aea441ea8bd43387a7d7edfc6c19/raw/Invoke-WithEncoding.ps1 | iex
  • Function Debug-NativeInOutput,它有助于诊断外部程序的编码问题,直接从这个 Gist如下(同样,你应该先检查):
# Download and define advanced function Debug-NativeInOutput in the current session.
irm https://gist.github.com/mklement0/eac1f18fbe0fc2798b214229b747e5dd/raw/Debug-NativeInOutput.ps1 | iex

下面是使用命令打印重音字符的示例命令python

与 Node.js 一样,Python 的行为是非标准的,虽然它不使用 UTF-8,但使用系统的活动ANSI (!) 代码页(而不是预期的OEM代码页)。

也就是说,即使您将 PowerShell 控制台切换为 UTF-8,默认情况下与 Python 脚本的通信也无法正常工作,除非做出额外的努力,这Invoke-WithEncoding可以为您封装:

注意:我在这里使用 Python 作为示例,以说明函数的工作原理。它能够使Python使用UTF-8,即由任一设置环境变量PYTHONUTF81或-在V3.7 + -通过使参数-X utf8(区分完全一致)。


Invoke-WithEncoding 例子:

# Outputs *already-decoded* output, so if the output *prints* fine, 
# then *decoding* worked fine too.
PS> Invoke-WithEncoding { python -c "print('eé')" } -Encoding Ansi -WindowsOnly
eé
  • 请注意,Invoke-WithEncoding确保对 .NET 字符串的实际解码发生在它输出之前,以便编码问题不会被 Windows 上看似正确的直接显示输出意外掩盖(更多信息见下文)。

  • -WindowsOnly 用于跨平台兼容性并确保在这种情况下编码仅适用于 Windows(在 Unix 上,Python 使用 UTF-8)。


Debug-NativeInOutput 例子:

使用默认的 PowerShell 控制台,使用系统的 OEM 代码页,您将看到以下输出,使用相同的 Python 命令,从 PowerShell (Core) 7.1 调用:

PS> Debug-NativeInOutput { python -c "print('eé')" }

  • 需要注意的DecodedOutput财产,显示错误-decoded结果基于解释Python的作为输出OEM -而不是ANSI编码:'e?'。(Input*属性为空,因为该命令不涉及Python 脚本的管道数据。)

  • 相比之下,通过直接显示打印,输出打印得很好(因为 Python 那时 - 并且只有那时 - 使用 Unicode),这隐藏了问题,但是一旦您想以编程方式处理输出 - 在变量中捕获,发送到管道中的另一个命令,重定向到文件 - 编码问题将浮出水面。

  • Invoke-WithEncoding,Debug-NativeInOutput支持一个-Encoding参数,所以如果你传递-Encoding Ansi给上面的调用,你会看到 Python 的输出被正确解码。

  • 输出反映了这样一个事实:在 PowerShell (Core) 中,$OutputEncoding默认为 UTF-8,而在 Windows PowerShell 中,它默认为 ASCII(!)。这种与实际编码的不匹配是有问题的,GitHub issue # 上的这个评论提出了一种在未来解决这个问题的方法(仅适用于 PowerShell (Core))。


以上是CMD管道与Powershell管道不同?的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>