这是一个有趣的话题.基本上,我有一个包含一些文本的图像.如何从图像中提取文本?
我已经尝试了很多东西,但我做的每件事都很乏味,而且通常都行不通.我只是想知道是否有一个相当简单的方法来做到这一点.
我发现了这个问题:http://sourceforge.net/projects/javaocr/.我已经尝试了好几个小时了,但是我无法Image将它转换成String图像中的文本.
谢谢大家!
由于我们有很多生成的代码,一些roslyn分析器对此代码感到疯狂.有没有办法从分析仪中排除一些文件?
我目前使用Managed Binary Analysis,看起来nuget添加了相同的规则(可能更少).
我也使用这个SonarQube插件:https://github.com/SonarQubeCommunity/sonar-fxcop.
准确的是什么?
我有一个Java项目,我已经工作了一段时间.设计开始时相当不错,但随着变化而慢慢退化.我正在寻找一种可以分析项目的工具.拥有不同类/方法的依赖关系的地图真的很不错.我觉得某些方法只是为了实现一个非常具体的目标.我想消除不必要的代码,让我的设计更好.
任何建议都会很棒!谢谢!
编辑:添加到此,同义词似乎与基本查询字符串查询一起使用.
"query_string" : {
"default_field" : "location.region.name.raw",
"query" : "nh"
}
Run Code Online (Sandbox Code Playgroud)
这将返回New Hampshire的所有结果,但"nh"的"匹配"查询不返回任何结果.
我正在尝试在我的弹性索引中添加同义词到我的位置字段,这样如果我搜索"Mass","Ma"或"Massachusetts",我每次都会得到相同的结果.我将同义词过滤器添加到我的设置中并更改了位置的映射.这是我的设置:
analysis":{
"analyzer":{
"synonyms":{
"filter":[
"lowercase",
"synonym_filter"
],
"tokenizer": "standard"
}
},
"filter":{
"synonym_filter":{
"type": "synonym",
"synonyms":[
"United States,US,USA,USA=>usa",
"Alabama,Al,Ala,Ala",
"Alaska,Ak,Alas,Alas",
"Arizona,Az,Ariz",
"Arkansas,Ar,Ark",
"California,Ca,Calif,Cal",
"Colorado,Co,Colo,Col",
"Connecticut,Ct,Conn",
"Deleware,De,Del",
"District of Columbia,Dc,Wash Dc,Washington Dc=>Dc",
"Florida,Fl,Fla,Flor",
"Georgia,Ga",
"Hawaii,Hi",
"Idaho,Id,Ida",
"Illinois,Il,Ill,Ills",
"Indiana,In,Ind",
"Iowa,Ia,Ioa",
"Kansas,Kans,Kan,Ks",
"Kentucky,Ky,Ken,Kent",
"Louisiana,La",
"Maine,Me",
"Maryland,Md",
"Massachusetts,Ma,Mass",
"Michigan,Mi,Mich",
"Minnesota,Mn,Minn",
"Mississippi,Ms,Miss",
"Missouri,Mo",
"Montana,Mt,Mont",
"Nebraska,Ne,Neb,Nebr",
"Nevada,Nv,Nev",
"New Hampshire,Nh=>Nh",
"New Jersey,Nj=>Nj",
"New Mexico,Nm,N Mex,New M=>Nm",
"New York,Ny=>Ny",
"North Carolina,Nc,N Car=>Nc",
"North Dakota,Nd,N …Run Code Online (Sandbox Code Playgroud) 我正在尝试将Microsoft.CodeAnalysis.FXCopAnalyzers(最新稳定版本)添加到我的 ASP.NET 项目中。当我通过 NuGet 安装它时,我收到了大量错误,例如:
无法从 \packages\Microsoft.CodeQuality.Analyzers.2.6.3\analyzers\dotnet\cs\Microsoft.CodeQuality.Analyzers.dll 创建分析器 Microsoft.CodeQuality.Analyzers.ApiDesignGuidelines.AbstractTypesShouldNotHaveConstructorsAnalyzer 的实例:无法加载文件或程序集'Microsoft.CodeAnalysis, Version=2.6.0.0, Culture=neutral, PublicKeyToken=31bf3856ad364e35' 或其依赖项之一。系统找不到指定的文件。无法从 \packages\Microsoft.CodeQuality.Analyzers.2.6.3\analyzers\dotnet\cs\Microsoft.CodeQuality.Analyzers 创建分析器 Microsoft.CodeQuality.Analyzers.ApiDesignGuidelines.AvoidEmptyInterfacesAnalyzer 的实例.dll:无法加载文件或程序集“Microsoft.CodeAnalysis,版本=2.6.0.0,文化=中性,PublicKeyToken=31bf3856ad364e35”或其依赖项之一。系统找不到指定的文件。无法从 \packages\Microsoft.CodeQuality.Analyzers.2.6.3\analyzers\dotnet\cs\Microsoft.CodeQuality.Analyzers 创建分析器 Microsoft.CodeQuality.Analyzers.ApiDesignGuidelines.CancellationTokenParametersMustComeLastAnalyzer 的实例.dll:无法加载文件或程序集“Microsoft.CodeAnalysis,版本=2.6.0.0,文化=中性,PublicKeyToken=31bf3856ad364e35”或其依赖项之一。该系统找不到指定的文件.. 版本=2.6.0.0,文化=中性,PublicKeyToken=31bf3856ad364e35' 或其依赖项之一。该系统找不到指定的文件.. 版本=2.6.0.0,文化=中性,PublicKeyToken=31bf3856ad364e35' 或其依赖项之一。该系统找不到指定的文件..
注意:为了简洁起见,我省略了 127 个错误。它们都非常相似。但需要注意的一件事是,并非所有分析器都在 Microsoft.CodeQuality 命名空间中。有些在 Microsoft.NetCore 中,有些在 Microsoft.NetFramework 中。
所以我说好的,我必须先安装Microsoft.CodeAnalysis v2.6.0.0。看起来很奇怪,这不是 NuGet 自动安装的依赖项,但无论如何。
所以我恢复了我在 Git 中的所有更改,重新打开解决方案,安装 Microsoft.CodeAnalysis v2.6.0.0,然后安装 Microsoft.CodeAnalysis.FXCopAnalyzers 的最新稳定版本。
同样的错误!
当我查看包/Microsoft.CodeAnalysis.2.6.0 时,我注意到那里没有 .dll 。安装它的正确方法是什么?安装 Microsoft.CodeAnalysis 甚至是正确的解决方案吗?为什么安装时没有自动安装Microsoft.CodeAnalysis.FXCopAnalyzers的依赖?这不是包管理器的全部意义吗?我的问题太多,答案太少。请帮忙。
哪个lucene分析仪可以用来正确处理日文?它应该能够处理汉字,平假名,片假名,罗马字及其任何组合.
我知道什么没有分析意味着什么.简而言之,该字段不会被指定的Analyzer标记.
但是,NO_NORMS意味着什么?我看到了文档,但请用简单的英语解释我.什么是索引时间字段和文档提升和字段长度规范化?
使用ES 1.2.1
我的聚合
{
"size": 0,
"aggs": {
"cities": {
"terms": {
"field": "city","size": 300000
}
}
}
Run Code Online (Sandbox Code Playgroud)
}
问题是某些城市名称中包含空格并单独汇总.
比如洛杉矶
{
"key": "Los",
"doc_count": 2230
},
{
"key": "Angeles",
"doc_count": 2230
},
Run Code Online (Sandbox Code Playgroud)
我认为它与分析仪有关?我会使用哪一个不拆分空格?
继MS的本教程之后,我为Roslyn创建了一个分析器.
根据该页面,您可以将规则标记为DiagnosticSeverity.Error,这将导致构建中断:
在声明"规则"字段的行中,您还可以将要生成的诊断的严重性更新为错误而不是警告.如果正则表达式字符串不解析,则Match方法肯定会在运行时抛出异常,您应该像编译C#编译器错误一样阻止构建.将规则的严重性更改为DiagnosticSeverity.Error:
内部静态DiagnosticDescriptor Rule = new DiagnosticDescriptor(DiagnosticId,Title,MessageFormat,Category,DiagnosticSeverity.Error,isEnabledByDefault:true,description:Description);
在我的代码中,我已经或多或少地创建了规则,如下所示:
private static readonly DiagnosticDescriptor Rule =
new DiagnosticDescriptor(DiagnosticId, Title, MessageFormat, Category,
DiagnosticSeverity.Error, true, helpLinkUri: HelpUrl);
Run Code Online (Sandbox Code Playgroud)
这条规则很好.它会抛出红线,它会在错误列表中显示消息.但是,构建成功,我能够成功运行该应用程序.
注意:我已创建此规则以捕获Thread.Sleep此示例.
是否需要额外的设置来确保规则中断构建?