如何解码编码为uXXXX的Unicode转义序列表情符号?
我正在尝试使用 python 对我下载的 Instagram 数据进行排序,数据是一个 json 文件,但表情符号和其他非文本字符的编码方式我不明白,例如:
json 文件将包含:
u00e2u009cu008cu00f0u009fu0096u00a4u00f0u009fu008du0095u00f0u009fu008eu00b6u00f0u009fu00a4u00af. 在 Instagram 应用程序上显示的是:
?
或 json: u00e2u0080u0099. Instagram:('撇号)
我尝试使用u"string"并在此处、此处和此处找到了类似的问题,但没有一个是在 python 中的,也没有向我提供任何有用的详细信息。
回答
尝试
print(('u00e2u009cu008cu00f0u009fu0096u00a4u00f0u009fu008du0095u00f0u009fu008eu00b6u00f0u009fu00a4u00af'.encode('latin-1').decode('utf-8')))
输出:
?