有谁知道OpenOffice字典文件的格式是什么?据我所知,每行有一个单词,有些标志可能会告诉我一些关于这个单词的内容.
以英语词典中的几行为例:
absoluteness/S
absorbency/SM
abstract/ShTVDPiGY
absurdness/S
Run Code Online (Sandbox Code Playgroud)
从挪威语词典中,我将使用它:
flatorm/AEG
flatpresse/W
flatseng/ACEG
flatside/ACDEFGHJ
flatskjerm/A
Run Code Online (Sandbox Code Playgroud)
例如"/ AEG"和"/ S"是什么意思?我假设每个字母/标志都有一定的含义,因此"/ AEG"中的A表示与"/ ACDEFGHJ"中的A相同.
我在各地搜索过,但我找不到任何信息.
我有一个网络应用程序,访问者正在注册并收到他们注册的电子邮件的简报.
我在注册表单中只使用了一个电子邮件字段,因为我希望减少字段数量,我想大多数人(像我一样)复制并粘贴电子邮件,这意味着拼写错误会传播到辅助验证字段.
我的问题是,相当一部分注册在电子邮件地址中有拼写错误,例如@yhaoo,@ hotmaill等.
我怎样才能有效地处理这样的错别字?
我想通过使用普通域的拼写错误列表来进行简单的自动更正,但我不能为此做一个现成的综合列表.
我有一个包含供应商信息的数据库:名称和地址(地址,城市,邮编和国家/地区).我需要搜索这个数据库并返回一些供应商.在搜索框中,用户可以输入任何内容:供应商的名称,地址的一部分,城市,邮政编码......如果我找不到任何结果,我需要像谷歌一样实施"你的意思是"向用户提供建议的功能.
我想过使用Solr/Lucene来做这件事.我已经安装了Solr,使用CSV文件导出了我需要的信息,并根据此文件创建了索引.现在,我可以使用solr.SpellCheckComponent从Solr字段获取建议.问题是我的建议是基于一个领域,需要它从地址,城市,邮编,国家和名称字段中获取信息.
在solr配置文件中我有这样的东西:
<searchComponent name="spellcheck" class="solr.SpellCheckComponent">
<str name="queryAnalyzerFieldType">textSpell</str>
<lst name="spellchecker">
<str name="name">default</str>
<str name="field">name</str>
<str name="spellcheckIndexDir">spellchecker</str>
</lst>
</searchComponent>
<requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">
<lst name="defaults">
<str name="spellcheck.onlyMorePopular">false</str>
<str name="spellcheck.extendedResults">false</str>
<str name="spellcheck.count>1</str>
</lst>
<arr name="last-components">
<str>spellcheck</str>
</arr>
</requestHandler>
Run Code Online (Sandbox Code Playgroud)
我可以运行如下查询:
http://localhost:8983/solr/spell?q=some_company_name&spellcheck=true&spellcheck.collate=true&spellcheck.build=true
Run Code Online (Sandbox Code Playgroud)
有谁知道如何更改我的配置文件,以获得多个字段的建议?
谢谢!!!
IntelliJ IDEA具有对源代码进行拼写检查的功能,可以分别为注释,文字和源代码本身打开和关闭此检查.但是,每个项目存储该设置.
有没有一种方法来关闭拼写的源代码检查,但不包括注释和文字跨越所有项目?为我创建的每个项目调整此设置都很繁琐.
我使用SVN tortoise(英文版)。可以附加其他语言的词典吗?
当我编写提交描述时(用波兰语),我想检查拼写。
我正在尝试在WPF RichTextBox中启用拼写检查。MSDN写道System.Windows.Controls.SpellCheck可用于为TextBox和RichTextBox控件启用拼写检查。
不幸的是,以下代码对我不起作用:
<RichTextBox SpellCheck.IsEnabled="True" xml:lang="en-US"></RichTextBox>
Run Code Online (Sandbox Code Playgroud)
这很奇怪,因为如果我使用普通的TextBox,它可以很好地工作(如果我拼错了一些东西,我会看到红线)。
不幸的是,每一个 答案我已经在SO到目前为止只提及到一套发现SpellCheck.IsEnabled,以True和设置Language属性为所支持的语言之一,但我不知道为什么在的情况下,我的计算机上应用此方法不工作内置RichTextBoxes?
更新:
如果我这样写,则运行中的文本将带有下划线:
<RichTextBox SpellCheck.IsEnabled="True">
<FlowDocument Language="en">
<Paragraph>
<Run>asdfasdf</Run>
</Paragraph>
</FlowDocument>
</RichTextBox>
Run Code Online (Sandbox Code Playgroud)
但是不幸的是,如果我尝试输入其他文本,它将被忽略。似乎该属性Language未在编辑的内容上设置为英语。我试图设置甚至Thread's CurrentCulture并且CurrentUICulture没有结果...
Internet Explorer 10内置了拼写检查功能,工作正常.我尝试创建一个小的HTML页面,用以下内容对其进行测试:
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML lang=en xml:lang="en" xmlns="http://www.w3.org/1999/xhtml"><HEAD>
<META name=GENERATOR content="MSHTML 10.00.9200.16721"></HEAD>
<BODY spellcheck=true contentEditable=true style="MARGIN: 0.5em">
<P>Theze ara mispeled wordz</P>
</BODY></HTML>
Run Code Online (Sandbox Code Playgroud)
所需要的只是放置属性spellcheck=true和contentEditable=true.
我也试过添加<meta http-equiv="X-UA-Compatible" content="IE=10" />例如
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML lang=en xml:lang="en" xmlns="http://www.w3.org/1999/xhtml"><HEAD>
<meta http-equiv="X-UA-Compatible" content="IE=10" />
<META name=GENERATOR content="MSHTML 10.00.9200.16721"></HEAD>
<BODY spellcheck=true contentEditable=true style="MARGIN: 0.5em">
<P>Theze ara mispeled wordz</P>
</BODY></HTML>
Run Code Online (Sandbox Code Playgroud)
就此而言,使用IE = edge而不是IE = 10没有任何区别: <meta http-equiv ="X-UA-Compatible"content …
delphi spell-checking c++builder webbrowser-control twebbrowser
我需要使用 Android 代码关闭拼写检查器。我怎么做?如果它不能通过代码关闭,有没有办法向用户显示拼写检查器选项,以便用户可以手动关闭它?谢谢
当我为我当前的项目开发界面时,我意识到WPF内置的拼写检查可用于TextBoxes等.我不知道为什么这让我感到惊讶,但确实如此.也许是因为我很习惯Winforms,它不包括拼写检查功能.
我完全没有意识到这一点,更重要的是,有点震惊,我从来没有注意到这样的功能在运行时被加载.你会认为加载单词列表会产生某种启动时间限制,因为内置字典显然非常好; 我试图测试它的功能,并提供了我甚至认为不会在标准字典中的单词.
基本上,我真的只是想知道如何在运行时初始化这样的功能.WPF如何处理加载单词?它是否会在计算机启动时将负载推迟到Windows环境中?它是否在每次启动应用程序时加载字典?据说字典位于磁盘上的某种可访问级别,以便我可以查看它吗?
我是 R 的真正初学者,我只有这两个列表,其中包含城市名称。一个列表包含用户生成的名称(人们拼写混乱),另一个列表包含名称的正字法。
我尝试使用包stringdist,最终得到了一个循环 (for) 并给出最接近匹配的代码。但我只能输入向量,而且我确实需要使用数据框。
这是我的代码(天哪,感觉很尴尬):
input <- "BAC" #misspelled
correct <- c("ABC", "DEF", "GHI", "JKL") #list with all correct names
shortest <- -1a
for (word in correct) {
dist <- stringdist(input, word)
#checks if it's a match!
if (dist == 0){
closest <- palavra
shortest <- 0
break
}
if(dist <= shortest || shortest < 0){
closest <- word
shortest <- dist
}
}
if(shortest == 0){
print("It's a match!")
} else {
print(closest)
}
Run Code Online (Sandbox Code Playgroud)
想法是使用这段代码来产生一个想法,我想从这里开始在数据帧的每一行中使用 …
spell-checking ×10
c# ×2
wpf ×2
android ×1
c++builder ×1
dataframe ×1
delphi ×1
dictionary ×1
email ×1
file-format ×1
lucene ×1
parsing ×1
r ×1
richtextbox ×1
solr ×1
stringdist ×1
svn ×1
textbox ×1
tortoisesvn ×1
twebbrowser ×1
windows-10 ×1