标签: spell-checking

OpenOffice词典的格式是什么?

有谁知道OpenOffice字典文件的格式是什么?据我所知,每行有一个单词,有些标志可能会告诉我一些关于这个单词的内容.

以英语词典中的几行为例:

absoluteness/S
absorbency/SM
abstract/ShTVDPiGY
absurdness/S
Run Code Online (Sandbox Code Playgroud)

从挪威语词典中,我将使用它:

flatorm/AEG
flatpresse/W
flatseng/ACEG
flatside/ACDEFGHJ
flatskjerm/A
Run Code Online (Sandbox Code Playgroud)

例如"/ AEG"和"/ S"是什么意思?我假设每个字母/标志都有一定的含义,因此"/ AEG"中的A表示与"/ ACDEFGHJ"中的A相同.

我在各地搜索过,但我找不到任何信息.

parsing dictionary file-format spell-checking

3
推荐指数
1
解决办法
1507
查看次数

处理电子邮件中的拼写错误或注册用户

我有一个网络应用程序,访问者正在注册并收到他们注册的电子邮件的简报.

我在注册表单中只使用了一个电子邮件字段,因为我希望减少字段数量,我想大多数人(像我一样)复制并粘贴电子邮件,这意味着拼写错误会传播到辅助验证字段.

我的问题是,相当一部分注册在电子邮件地址中有拼写错误,例如@yhaoo,@ hotmaill等.

我怎样才能有效地处理这样的错别字?

我想通过使用普通域的拼写错误列表来进行简单的自动更正,但我不能为此做一个现成的综合列表.

email spell-checking email-validation

3
推荐指数
2
解决办法
673
查看次数

Solr/Lucene基于多个字段的拼写检查建议

我有一个包含供应商信息的数据库:名称和地址(地址,城市,邮编和国家/地区).我需要搜索这个数据库并返回一些供应商.在搜索框中,用户可以输入任何内容:供应商的名称,地址的一部分,城市,邮政编码......如果我找不到任何结果,我需要像谷歌一样实施"你的意思是"向用户提供建议的功能.

我想过使用Solr/Lucene来做这件事.我已经安装了Solr,使用CSV文件导出了我需要的信息,并根据此文件创建了索引.现在,我可以使用solr.SpellCheckComponent从Solr字段获取建议.问题是我的建议是基于一个领域,需要它从地址,城市,邮编,国家和名称字段中获取信息.

在solr配置文件中我有这样的东西:

<searchComponent name="spellcheck" class="solr.SpellCheckComponent">
<str name="queryAnalyzerFieldType">textSpell</str>

<lst name="spellchecker">
    <str name="name">default</str>
    <str name="field">name</str>
    <str name="spellcheckIndexDir">spellchecker</str>
</lst>
</searchComponent>

<requestHandler name="/spell" class="solr.SearchHandler" startup="lazy">
    <lst name="defaults">
        <str name="spellcheck.onlyMorePopular">false</str>
        <str name="spellcheck.extendedResults">false</str>
        <str name="spellcheck.count>1</str>
    </lst>
    <arr name="last-components">
        <str>spellcheck</str>
    </arr>
</requestHandler>
Run Code Online (Sandbox Code Playgroud)

我可以运行如下查询:

http://localhost:8983/solr/spell?q=some_company_name&spellcheck=true&spellcheck.collate=true&spellcheck.build=true
Run Code Online (Sandbox Code Playgroud)

有谁知道如何更改我的配置文件,以获得多个字段的建议?

谢谢!!!

lucene solr spell-checking

3
推荐指数
2
解决办法
4742
查看次数

在所有项目中禁用IntelliJ IDEA中的代码拼写检查

IntelliJ IDEA具有对源代码进行拼写检查的功能,可以分别为注释,文字和源代码本身打开和关闭此检查.但是,每个项目存储该设置.

有没有一种方法来关闭拼写的源代码检查,但不包括注释和文字跨越所有项目?为我创建的每个项目调整此设置都很繁琐.

spell-checking intellij-idea

3
推荐指数
1
解决办法
2004
查看次数

Tortoise SVN 中的拼写检查

我使用SVN tortoise(英文版)。可以附加其他语言的词典吗?
当我编写提交描述时(用波兰语),我想检查拼写。

svn tortoisesvn spell-checking

3
推荐指数
1
解决办法
1879
查看次数

拼写检查不适用于WPF RichTextBox

我正在尝试在WPF RichTextBox中启用拼写检查。MSDN写道System.Windows.Controls.SpellCheck可用于为TextBox和RichTextBox控件启用拼写检查。

不幸的是,以下代码对我不起作用:

<RichTextBox SpellCheck.IsEnabled="True" xml:lang="en-US"></RichTextBox>
Run Code Online (Sandbox Code Playgroud)

这很奇怪,因为如果我使用普通的TextBox,它可以很好地工作(如果我拼错了一些东西,我会看到红线)。

不幸的是,每一个 答案我已经在SO到目前为止只提及到一套发现SpellCheck.IsEnabled,以True和设置Language属性为所支持的语言之一,但我不知道为什么在的情况下,我的计算机上应用此方法不工作内置RichTextBoxes?

更新:

如果我这样写,则运行中的文本将带有下划线:

<RichTextBox SpellCheck.IsEnabled="True">
    <FlowDocument Language="en">
         <Paragraph>
             <Run>asdfasdf</Run>
         </Paragraph>
    </FlowDocument>
</RichTextBox>
Run Code Online (Sandbox Code Playgroud)

但是不幸的是,如果我尝试输入其他文本,它将被忽略。似乎该属性Language未在编辑的内容上设置为英语。我试图设置甚至Thread's CurrentCulture并且CurrentUICulture没有结果...

c# wpf textbox spell-checking richtextbox

3
推荐指数
1
解决办法
3803
查看次数

TWebBrowser(TEmbeddedWB)控件中的拼写检查程序

Internet Explorer 10内置了拼写检查功能,工作正常.我尝试创建一个小的HTML页面,用以下内容对其进行测试:

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML lang=en xml:lang="en" xmlns="http://www.w3.org/1999/xhtml"><HEAD>
<META name=GENERATOR content="MSHTML 10.00.9200.16721"></HEAD>
<BODY spellcheck=true contentEditable=true style="MARGIN: 0.5em">
<P>Theze ara mispeled wordz</P>
</BODY></HTML>
Run Code Online (Sandbox Code Playgroud)

所需要的只是放置属性spellcheck=truecontentEditable=true.

我也试过添加<meta http-equiv="X-UA-Compatible" content="IE=10" />例如

<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.0 Transitional//EN">
<HTML lang=en xml:lang="en" xmlns="http://www.w3.org/1999/xhtml"><HEAD>
<meta http-equiv="X-UA-Compatible" content="IE=10" />
<META name=GENERATOR content="MSHTML 10.00.9200.16721"></HEAD>
<BODY spellcheck=true contentEditable=true style="MARGIN: 0.5em">
<P>Theze ara mispeled wordz</P>
</BODY></HTML>
Run Code Online (Sandbox Code Playgroud)

就此而言,使用IE = edge而不是IE = 10没有任何区别: <meta http-equiv ="X-UA-Compatible"content …

delphi spell-checking c++builder webbrowser-control twebbrowser

3
推荐指数
1
解决办法
1045
查看次数

如何使用 Android 中的代码关闭拼写检查器?

我需要使用 Android 代码关闭拼写检查器。我怎么做?如果它不能通过代码关闭,有没有办法向用户显示拼写检查器选项,以便用户可以手动关闭它?谢谢

android spell-checking

3
推荐指数
1
解决办法
1523
查看次数

WPF拼写检查如何在内部工作?

当我为我当前的项目开发界面时,我意识到WPF内置的拼写检查可用于TextBoxes等.我不知道为什么这让我感到惊讶,但确实如此.也许是因为我很习惯Winforms,它不包括拼写检查功能.

在此输入图像描述

我完全没有意识到这一点,更重要的是,有点震惊,我从来没有注意到这样的功能在运行时被加载.你会认为加载单词列表会产生某种启动时间限制,因为内置字典显然非常好; 我试图测试它的功能,并提供了我甚至认为不会在标准字典中的单词.

基本上,我真的只是想知道如何在运行时初始化这样的功能.WPF如何处理加载单词?它是否会在计算机启动时将负载推迟到Windows环境中?它是否在每次启动应用程序时加载字典?据说字典位于磁盘上的某种可访问级别,以便我可以查看它吗?

c# wpf spell-checking windows-10

3
推荐指数
1
解决办法
125
查看次数

获取两个列表之间最接近的字符串匹配

我是 R 的真正初学者,我只有这两个列表,其中包含城市名称。一个列表包含用户生成的名称(人们拼写混乱),另一个列表包含名称的正字法。

我尝试使用包stringdist,最终得到了一个循环 (for) 并给出最接近匹配的代码。但我只能输入向量,而且我确实需要使用数据框。

这是我的代码(天哪,感觉很尴尬):

 input <- "BAC"   #misspelled 
  correct <- c("ABC", "DEF", "GHI", "JKL") #list with all correct names
  shortest <- -1a

for (word in correct) {

  dist <- stringdist(input, word)
  #checks if it's a match!
  if (dist == 0){
    closest <- palavra
    shortest <- 0

    break

  }

  if(dist <= shortest || shortest < 0){
    closest <- word
    shortest <- dist

  }

}


if(shortest == 0){ 
  print("It's a match!")
} else {
  print(closest)
}
Run Code Online (Sandbox Code Playgroud)

想法是使用这段代码来产生一个想法,我想从这里开始在数据帧的每一行中使用 …

spell-checking r dataframe stringdist

3
推荐指数
1
解决办法
1561
查看次数