以相同的顺序将模式的所有元素与向量匹配

我创建了一个函数yes.seq,它接受两个参数,一个 patternpat和 data dat。该函数查找数据中是否存在相同序列的模式

例如

dat <- letters[1:10]
dat
[1] "a" "b" "c" "d" "e" "f" "g" "h" "i" "j"
pat <- c('a',"c","g")
 
yes.seq(pat = pat,dat = dat)
# [1] TRUE

因为这个序列在模式中并且以相同的顺序

"a"“b” "c"“d”“e”“f” "g"“h”“i”“j”

例如,如果 'dat' 被反转,那么我们得到FALSE

yes.seq(pat = pat, dat = rev(dat))
# [1] FALSE

这是我的功能

yes.seq <- function(pat , dat){  
  lv <- rep(F,length(pat))
  k <- 1     
  for(i in 1:length(dat)){        
            if(dat[i] == pat[k]) 
              {
              lv[k] <- TRUE
              k <- k+1 
              }       
    if(k==length(pat)+1) break
  }
  return(  all(lv)   )
}

有没有更有效的解决方案,这个功能对我来说太慢了

回答

我们可以paste使用它们grepl

grepl(paste(pat, collapse=".*"), paste(dat, collapse=""))
#[1] TRUE

或者 str_detect

library(stringr)
str_detect(paste(dat, collapse=""), paste(pat, collapse=".*"))
#[1] TRUE


回答

另外一个选项:

yes.seq <- function(pat, dat) {
  all(pat %in% dat) && all(diff(na.omit(match(pat, dat))) > 0)
}
yes.seq(pat, dat)
# [1] TRUE
yes.seq(c(pat, "ZZ"), dat)
# [1] FALSE
yes.seq(pat, rev(dat))
# [1] FALSE

  • These solutions fail, however, if any element in pat shows up before the pattern occurs. `yes.seq(pat = c("a", "b"), dat = c("b", "a", "b")) # returns FALSE`

以上是以相同的顺序将模式的所有元素与向量匹配的全部内容。
THE END
分享
二维码
< <上一篇
下一篇>>