我在哪里可以找到一些真实的拼写错误统计数据?
我试图将人们的输入文本与内部对象进行匹配,人们往往会犯拼写错误.
有两种错误:
typos
- "Helllo"而不是"Hello"/"Satudray"而不是"Saturday"等. Spelling
- "Shikago"而不是"芝加哥" 我使用 Damerau-Levenshtein距离进行拼写错误,使用Double Metaphone进行拼写(Python实现此处和此处).
我想专注于Damerau-Levenshtein(或简单地说edit-distance
).教科书实现总是使用'1'来表示删除,插入替换和转置的权重.虽然这很简单并且允许很好的算法但它与"现实"/"真实世界概率"不匹配.
例子:
删除,插入,替换和转置的"真实世界"权重应该是什么?
即使是Norvig非常酷的拼写校正器也使用非加权编辑距离.
BTW-我确定权重需要是函数而不是简单的浮点数(根据上面的例子)......
我可以调整算法,但在哪里可以"学习"这些权重?我无法访问Google规模的数据 ...
我应该猜猜他们吗?
编辑 - 尝试回答用户问题:
我想用Rmarkdown写一份报告.但是,我有点担心我的拼写.我希望我的Rstudio中安装了一个包可以自动帮我拼写检查.
那么,是否有这样的包或有办法解决这个问题?
我有阅读障碍症,并且正在与使用IDE Visual Studio 2013的其他学生开始我的第一个合作项目.我担心我的错过拼写可能会给团队的其他成员带来错误和烦恼,所以我希望将拼写错误降到最低.
我独自工作的项目不是一个问题,好像我拼写错误的单词我倾向于以同样的方式在整个程序中拼写错误 - 但我觉得我仍然可以使用拼写检查器来解决这些问题.
我有一个谷歌,但只发现了一些插件,其中大部分是过时的.任何帮助深表感谢.
spell-checking spelling visual-studio misspelling visual-studio-2013
我希望能够使用键盘快捷键用谷歌推荐的更正替换谷歌文档中拼写错误的单词,而不必将鼠标悬停在单词上,右键单击它,然后选择更正的单词。
有没有办法做到这一点?(我在 Mac 上工作)。
我需要将spellcheck
属性添加到一些<textarea>
和<input>
元素.我的问题是:"英语的版本是否 spellcheck
符合可配置性?" 我在澳大利亚,我们使用英国英语.我的理解是拼写检查器默认配置为美式英语.
它与lang
最初在html
元素上设置的属性有什么关系吗?
我启用了默认的Eclipse拼写检查程序.当我在Java编辑器中工作时检测到拼写错误时,我可以Ctrl-1
用来显示建议的拼写更正列表.
但是,当我在默认的XML编辑器中工作时,Ctrl-1
似乎不起作用.拼写错误的单词(在评论中大多数)用红色正确加下划线,但我似乎无法弄清楚如何获得拼写建议列表.
如果这是特定于平台的问题,我正在使用OpenJDK 6在Ubuntu 10.06上运行Eclipse Helios.
我正在收集调查数据(使用开放数据工具包),我的现场团队,祝福他们的心,有时会对人名的拼写有点创意.所以我有一个"正确的"响应者名称,以及链接到"家庭成员名称"变量的一些记录的年龄变量.有许多不同年龄的家庭成员.我想要受访年龄.
这是一些说明我的问题的虚假数据:
#the respondent
r = data.frame(name = c("Barack Obama", "George Bush", "Hillary Clinton"))
#a male member
m = data.frame(name = c("Barack Obama","George", "Wulliam Clenton"), age = c(55,59,70)); m$name=as.character(m$name)
#a female member
f = data.frame(name = c("Michelle O","Laura Busch", "Hillary Rodham Clinton"), age = c(54,58,69)); f$name=as.character(f$name)
#if the responsent is the the given member, record their age. if not, NA
a = cbind(
ifelse(r$name==m$name,m$age,NA)
,ifelse(r$name==f$name,f$age,NA)
)
#make a function for plyr that gives me the age of the matched respondent …
Run Code Online (Sandbox Code Playgroud) 我正在寻找一种相对快速的方法来检查单词是否拼写错误,无论是使用gem还是API.
我尝试过使用几种宝石 - raspell,ffi-aspell,hunspell-ffi,spell_cheker和spellchecker--每种都有不同的错误.
我对ruby很新,并希望有一个简单的解决方案(我正在处理大量的短文本文件,并且想要计算错误拼写的单词的百分比),这不包括从头开始构建的东西.
尝试ffi-aspell时,我收到以下错误:
/Users/ntaylorthompson/.rvm/gems/ruby-1.9.2-p320/gems/ffi-aspell-0.0.3/lib/ffi/aspell/speller.rb:121: [BUG] Segmentation fault
ruby 1.9.2p320 (2012-04-20 revision 35421) [x86_64-darwin11.4.0]
-- control frame ----------
c:0005 p:---- s:0019 b:0019 l:000018 d:000018 CFUNC :speller_check
c:0004 p:0113 s:0013 b:0013 l:000012 d:000012 METHOD /Users/ntaylorthompson/.rvm/gems/ruby-1.9.2-p320/gems/ffi-aspell-0.0.3/lib/ffi/aspell/speller.rb:121
c:0003 p:0049 s:0007 b:0007 l:0005a8 d:0005d0 EVAL ffi-aspell_test.rb:5
c:0002 p:---- s:0004 b:0004 l:000003 d:000003 FINISH
c:0001 p:0000 s:0002 b:0002 l:0005a8 d:0005a8 TOP
---------------------------
-- Ruby level backtrace information ----------------------------------------
ffi-aspell_test.rb:5:in `<main>'
/Users/ntaylorthompson/.rvm/gems/ruby-1.9.2-p320/gems/ffi-aspell-0.0.3/lib/ffi/aspell/speller.rb:121:in `correct?'
/Users/ntaylorthompson/.rvm/gems/ruby-1.9.2-p320/gems/ffi-aspell-0.0.3/lib/ffi/aspell/speller.rb:121:in `speller_check'
-- C level backtrace information -------------------------------------------
[NOTE]
You may …
Run Code Online (Sandbox Code Playgroud) 用右键单击添加单词 - >拼写 - >'错字:将'foo'保存到字典'去?如何从那里删除它们?