如何解码编码为uXXXX的Unicode转义序列表情符号？

html5 • 2022年10月25日 pm9:26 • 问答

我正在尝试使用 python 对我下载的 Instagram 数据进行排序，数据是一个 json 文件，但表情符号和其他非文本字符的编码方式我不明白，例如：

json 文件将包含：
u00e2u009cu008cu00f0u009fu0096u00a4u00f0u009fu008du0095u00f0u009fu008eu00b6u00f0u009fu00a4u00af. 在 Instagram 应用程序上显示的是：
?

或 json: u00e2u0080u0099. Instagram：（'撇号）

我尝试使用u"string"并在此处、此处和此处找到了类似的问题，但没有一个是在 python 中的，也没有向我提供任何有用的详细信息。

尝试

print(('u00e2u009cu008cu00f0u009fu0096u00a4u00f0u009fu008du0095u00f0u009fu008eu00b6u00f0u009fu00a4u00af'.encode('latin-1').decode('utf-8')))

输出：

以上是如何解码编码为uXXXX的Unicode转义序列表情符号？的全部内容。

THE END

二维码

我们可以假设所有正整数x==(int)sqrt(x*x)吗？

如何替换字符串中的字符列表

下一篇>>

搜索内容