如何将格式化的字符串转换为纯文本

用户复制粘贴并以以下格式发送数据:“”我需要将其转换为纯 txt(我们可以说是 ascii 字符),例如 'jovy debbie' 它有不同的字体和格式:例如:''''

任何帮助都会受到赞赏,我已经提到了其他堆栈溢出问题,但没有运气:(

回答

这些字母来自数学字母数字符号块。

由于它们与 ASCII 对应物有固定的偏移量,因此您可以使用tr它们来映射它们,例如:

" ".tr("-", "a-z")
#=> "jovy debbie"

相同的方法可用于其他样式,例如

" ".tr("--", "a-zA-Z")
#=> "Jenica Dugos"

这使您可以完全控制字符映射。

或者,您可以尝试Unicode normalization。NFKC / NFKD 表单应该删除大多数格式,并且似乎适用于您的示例:

" ".unicode_normalize(:nfkc)
#=> "jovy debbie"

" ".unicode_normalize(:nfkc)
#=> "Jenica Dugos"


以上是如何将格式化的字符串转换为纯文本的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>