标签: text-manipulation

如何用C#在回车上拆分字符串？

我有一个ASP.NET页面,其中包含一个名为txbUserName的多行文本框.然后我将3个名称粘贴到文本框中,它们是垂直对齐的:

贾森
书童
卡伦

我希望能够以某种方式获取名称,并在检测到回车或新行时将它们拆分为单独的字符串.我认为阵列可能是要走的路.有任何想法吗？

谢谢.

c# text-manipulation

Eri*_*ica

2015 06-30

57
推荐指数

2
解决办法

8万
查看次数

从sed/START /,/ END /中排除第一行和最后一行

考虑输入:

=sec1=
some-line
some-other-line

foo
bar=baz

=sec2=
c=baz

Run Code Online (Sandbox Code Playgroud)

如果我只想处理= sec1 =我可以通过以下方式注释掉该部分:

sed -e '/=sec1=/,/=[a-z]*=/s:^:#:' < input

Run Code Online (Sandbox Code Playgroud)

......好吧,差不多.

这将注释包括 "= sec1 ="和"= sec2 ="行的行,结果将类似于:

#=sec1=
#some-line
#some-other-line
#
#foo
#bar=baz
#
#=sec2=
c=baz

Run Code Online (Sandbox Code Playgroud)

我的问题是:在sed中从/ START /,/ END /范围中排除开始和结束行的最简单方法是什么？

我知道在很多情况下,"s :::"爪子的细化可以在这种特定情况下给出解决方案,但我在这里遵循通用解决方案.

在" Sed - An Introduction and Tutorial "中,Bruce Barnett写道:"我稍后会告诉你如何限制命令,但不包括包含指定模式的行."但是我无法找到他实际显示的位置这个.

在由Eric Pement编写的" 有用的SED单行文章"中,我只能找到包容性的例子:

# print section of file between two regular expressions (inclusive)
sed -n '/Iowa/,/Montana/p'             # case sensitive

Run Code Online (Sandbox Code Playgroud)

unix scripting sed text-manipulation

Che*_*evy

2012 08-20

44
推荐指数

3
解决办法

2万
查看次数

如何从MySQL中的文本字段中提取两个连续数字？

我有一个MySQL数据库,我有一个查询:

SELECT `id`, `originaltext` FROM `source` WHERE `originaltext` regexp '[0-9][0-9]'

Run Code Online (Sandbox Code Playgroud)

这将检测所有包含2位数字的原始文本.

我需要MySQL将这些数字作为字段返回,所以我可以进一步操作它们.

理想情况下,如果我可以添加额外的标准,应该> 20将是伟大的,但我也可以单独做.

regex mysql text-manipulation

Ste*_*eve

2018 06-20

27
推荐指数

2
解决办法

5万
查看次数

如何在一行中获得短统计的Git日志？

以下命令在控制台上输出以下文本行

git log --pretty=format:"%h;%ai;%s" --shortstat
ed6e0ab;2014-01-07 16:32:39 +0530;Foo
 3 files changed, 14 insertions(+), 13 deletions(-)

cdfbb10;2014-01-07 14:59:48 +0530;Bar
 1 file changed, 21 insertions(+)

5fde3e1;2014-01-06 17:26:40 +0530;Merge Baz
772b277;2014-01-06 17:09:42 +0530;Qux
 7 files changed, 72 insertions(+), 7 deletions(-)

Run Code Online (Sandbox Code Playgroud)

我有兴趣让上面的格式像这样显示

ed6e0ab;2014-01-07 16:32:39 +0530;Foo;3;14;13
cdfbb10;2014-01-07 14:59:48 +0530;Bar;1;21;0
5fde3e1;2014-01-06 17:26:40 +0530;Merge Baz;0;0;0
772b277;2014-01-06 17:09:42 +0530;Qux;7;72;7

Run Code Online (Sandbox Code Playgroud)

这将在某些报告中使用,该报告可以解析以分号分隔的值.事情是文本"\n 3 files changed, 14 insertions(+), 13 deletions(-)"(包括新行)被转换为3;14;13(没有新行)一个可能的角落案例是文本"5fde3e1;2014-01-06 17:26:40 +0530;Merge Baz",其中没有这样的行.在那种情况下我想要;0;0;0

总体而言,目标是分析一段时间内的文件更改统计信息.我阅读了git日志文档,但找不到任何可以帮助我以这种格式呈现的格式.我提出的最好的是上面提到的命令.

因此,任何可以生成预期格式的命令或shell脚本都会有很大帮助.

谢谢!

git shell text-processing text-manipulation git-log

Ank*_*ush

lucky-day

22
推荐指数

5
解决办法

8116
查看次数

Java正则表达式:换行符+空格

应该很简单,但我会发疯的.

给出如下文字:

line number 1
line number 2
 line number 2A
line number 3
 line number 3A
 line number 3B
line number 4

Run Code Online (Sandbox Code Playgroud)

我需要删除行终止符的Java正则表达式,然后新行以空格开头,以便上面的示例文本变为:

line number 1
line number 2line number 2A
line number 3line number 3Aline number 3B
line number 4

Run Code Online (Sandbox Code Playgroud)

java regex text-manipulation

Mat*_*oSp

lucky-day

14
推荐指数

2
解决办法

6万
查看次数

sed - 注释匹配的行和后面的x行

我需要帮助使用sed来评论匹配的行和它后面的4行.在文本文件中.

我的文本文件是这样的:

[myprocess-a]
property1=1
property2=2
property3=3
property4=4

[anotherprocess-b]
property1=gffgg
property3=gjdl
property2=red
property4=djfjf

[myprocess-b]
property1=1
property4=4
property2=2
property3=3

Run Code Online (Sandbox Code Playgroud)

我希望在所有带有文本'[myprocess'的行和前面有4行的预期输出前面加上#:

#[myprocess-a]
#property1=1
#property2=2
#property3=3
#property4=4

[anotherprocess-b]
property1=gffgg
property3=gjdl
property2=red
property4=djfjf

#[myprocess-b]
#property1=1
#property4=4
#property2=2
#property3=3

Run Code Online (Sandbox Code Playgroud)

非常感谢您对此的帮助.

sed text-manipulation

San*_*ero

lucky-day

13
推荐指数

1
解决办法

7880
查看次数

PHP修复坏文本

这是我正在努力的事情,我希望StackOverflow上的聪明人提供输入.

我正在尝试的是基于组合相同文本页面的各种不良版本来修复文本的功能.基本上,这可以用于将不同的OCR结果组合成一个,其精度高于其中任何一个.

我从一本600,000英文单词的字典开始,这几乎包括法律和医学术语以及常用名称.我已经有了.

然后我有4个版本的文本示例.

像这样的东西:

$text[0] = 'Fir5t text sample is thisline';
$text[1] = 'Fir5t text Smplee is this line.';
$text[2] = 'First te*t sample i this l1ne.';
$text[3] = 'F i r st text s ample is this line.';

Run Code Online (Sandbox Code Playgroud)

我试图结合上面的内容来得到一个看起来像这样的输出:

$text = 'First text sample is this line.';

Run Code Online (Sandbox Code Playgroud)

不要告诉我这是不可能的,因为它肯定不是,非常困难.

我非常感谢任何人对此有任何想法.

谢谢!

我目前的想法:

只检查字典中的单词是行不通的,因为有些空格位于错误的位置,偶尔单词不会出现在字典中.

主要关注的是修复损坏的间距,一旦修复,那么如果存在则可以选择最常出现的字典单词,或者最常出现的非字典单词.

php algorithm ocr text text-manipulation

Ala*_*air

lucky-day

12
推荐指数

2
解决办法

356
查看次数

将str_word_count用于UTF8文本

我有这个文字:

$text  = "Ba?ka, küskün otomobil kaçt? buraya küskün otomobil neden kaçt?
          kaçt? buraya, oraya KISMEN @here #there J.J.Johanson hep.
          Danny:Where is mom? I don't know! Café est weiß for 2 €uros.
          My 2nd nickname is mike18.";

Run Code Online (Sandbox Code Playgroud)