use*_*rda 5 c# ocr computer-vision microsoft-cognitive azure-cognitive-services
我正在使用计算机视觉API提供的示例C#快速入门 我能够获得示例中所示的JSON结果,但无法仅获取文本内容.
JSON的示例格式如下:
{
"textAngle": 0.020943951023932542,
"orientation": "NotDetected",
"language": "de",
"regions": [
{
"boundingBox": "46,54,59,71",
"lines": [
{
"boundingBox": "48,54,49,19",
"words": [
{
"boundingBox": "48,54,49,19",
"text": "Hello"
}
]
},
{
"boundingBox": "46,106,59,19",
"words": [
{
"boundingBox": "46,106,59,19",
"text": "World"
}
]
}
]
}
]
}
Run Code Online (Sandbox Code Playgroud)
目前,我正在使用JSON转换器通过使用以下类结构为每个单词添加换行来提取文本节点.
public class Region
{
public string BoundingBox { get; set; }
public List<Line> Lines { get; set; }
}
public class Line
{
public string BoundingBox { get; set; }
public List<Word> Words { get; set; }
}
public class Word
{
public string BoundingBox { get; set; }
public string Text { get; set; }
}
Run Code Online (Sandbox Code Playgroud)
API中是否提供了任何请求参数来获取响应本身的直接文本?
小智 5
如果您希望返回的响应使用C#类型,则可以使用github中的官方客户端SDK 。在NuGet中也可用。
一旦有了OcrResults
,并且只需要文本,就可以使用Linq编写一些骇人的C#代码,如下所示:
string OcrResultsToString(OcrResult result)
{
return string.Join("\n",
result.Regions.ToList().Select(region =>
string.Join(" ", region.Lines.ToList().Select(line =>
string.Join(" ", line.Words.ToList().Select(word =>
word.Text).ToArray())).ToArray())).ToArray());
}
Run Code Online (Sandbox Code Playgroud)
或者,如果这伤了您的眼睛,则可以使用如下所示的常规循环:
string OcrResultsToString(OcrResults results)
{
StringBuilder stringBuilder = new StringBuilder();
if (results != null && results.Regions != null)
{
foreach (var item in results.Regions)
{
foreach (var line in item.Lines)
{
foreach (var word in line.Words)
{
stringBuilder.Append(word.Text);
stringBuilder.Append(" ");
}
stringBuilder.AppendLine();
}
stringBuilder.AppendLine();
}
}
return stringBuilder.ToString();
}
Run Code Online (Sandbox Code Playgroud)
归档时间: |
|
查看次数: |
2015 次 |
最近记录: |