从R中的文本文档中删除前n个单词

html5 • 2022年9月5日 pm1:29 • 问答

我在 R 中遇到问题，但在 Stackoverflow 中找不到类似的解决方案。

我有一个包含许多不同文本文档的数据框。我尝试 gsub 在特定模式后从文本文档中删除一些字符。这工作正常，但现在我有一个问题，我想从每个文本文档中删除前 5 个单词。

通过示例：

解决方案应该是：

这在 R 中可能具有特定功能吗？这对我有很大帮助。

亲切的问候，汤姆

回答

类似的选项 str_remove

library(stringr)
str_remove(s, '(\w+\s+){5}')
#[1] "I like Bananas"   "I like Chocolate"

s <- c("Hey I am Tom and I like Bananas", "Hey I am Moritz and I like Chocolate")

以上是从R中的文本文档中删除前n个单词的全部内容。

THE END

二维码

在Powershell中使用升级的FolderBrowserDialog（“Vista风格”）

下一篇>>