如何将格式化的字符串转换为纯文本
用户复制粘贴并以以下格式发送数据:“”我需要将其转换为纯 txt(我们可以说是 ascii 字符),例如 'jovy debbie' 它有不同的字体和格式:例如:''''
任何帮助都会受到赞赏,我已经提到了其他堆栈溢出问题,但没有运气:(
回答
这些字母来自数学字母数字符号块。
由于它们与 ASCII 对应物有固定的偏移量,因此您可以使用tr它们来映射它们,例如:
" ".tr("-", "a-z")
#=> "jovy debbie"
相同的方法可用于其他样式,例如
" ".tr("--", "a-zA-Z")
#=> "Jenica Dugos"
这使您可以完全控制字符映射。
或者,您可以尝试Unicode normalization。NFKC / NFKD 表单应该删除大多数格式,并且似乎适用于您的示例:
" ".unicode_normalize(:nfkc)
#=> "jovy debbie"
" ".unicode_normalize(:nfkc)
#=> "Jenica Dugos"