Geo*_*tas 2 text spell-checking r
要检查的文本是希腊语,但我想知道是否也可以用英语单词.我最初的想法在这里描述,我已经找到了一种使用VBA的方法.但是我想知道是否有办法用R来做.如果在R中没有办法,你会想到比Excel-vba更好的东西吗?
或者,OpenOffice附带一个字典,该字典存储在文本文件中.您可以阅读并删除单词定义以创建单词列表.
这是在v3.0上测试的; 文件位置可能已移位,文件名将根据您想要的字典而改变.
library(stringr)
dict <- readLines("C:/Program Files/OpenOffice.org 3/share/uno_packages/cache/uno_packages/174.tmp_/dict-en.oxt/th_en_US_v2.dat")
is_word <- str_detect(dict, "^[^(]")
words <- str_split_fixed(dict[is_word], "\\|", 2)
words <- words[,1]
Run Code Online (Sandbox Code Playgroud)
此列表包含一些多字短语.您可能更喜欢拆分第一个空格,并采用唯一值.您可能还想写入words文件,以保存自己的重复.
完成后,检查一个单词就像这样简单
c("persnickety", "sqwrzib") %in% words # TRUE FALSE
Run Code Online (Sandbox Code Playgroud)