我有一个ASP.NET页面,其中包含一个名为txbUserName的多行文本框.然后我将3个名称粘贴到文本框中,它们是垂直对齐的:
我希望能够以某种方式获取名称,并在检测到回车或新行时将它们拆分为单独的字符串.我认为阵列可能是要走的路.有任何想法吗?
谢谢.
考虑输入:
=sec1=
some-line
some-other-line
foo
bar=baz
=sec2=
c=baz
Run Code Online (Sandbox Code Playgroud)
如果我只想处理= sec1 =我可以通过以下方式注释掉该部分:
sed -e '/=sec1=/,/=[a-z]*=/s:^:#:' < input
Run Code Online (Sandbox Code Playgroud)
......好吧,差不多.
这将注释包括 "= sec1 ="和"= sec2 ="行的行,结果将类似于:
#=sec1=
#some-line
#some-other-line
#
#foo
#bar=baz
#
#=sec2=
c=baz
Run Code Online (Sandbox Code Playgroud)
我的问题是:在sed中从/ START /,/ END /范围中排除开始和结束行的最简单方法是什么?
我知道在很多情况下,"s :::"爪子的细化可以在这种特定情况下给出解决方案,但我在这里遵循通用解决方案.
在" Sed - An Introduction and Tutorial "中,Bruce Barnett写道:"我稍后会告诉你如何限制命令,但不包括包含指定模式的行."但是我无法找到他实际显示的位置这个.
在由Eric Pement编写的" 有用的SED单行文章"中,我只能找到包容性的例子:
# print section of file between two regular expressions (inclusive)
sed -n '/Iowa/,/Montana/p' # case sensitive
Run Code Online (Sandbox Code Playgroud) 我有一个MySQL数据库,我有一个查询:
SELECT `id`, `originaltext` FROM `source` WHERE `originaltext` regexp '[0-9][0-9]'
Run Code Online (Sandbox Code Playgroud)
这将检测所有包含2位数字的原始文本.
我需要MySQL将这些数字作为字段返回,所以我可以进一步操作它们.
理想情况下,如果我可以添加额外的标准,应该> 20将是伟大的,但我也可以单独做.
以下命令在控制台上输出以下文本行
git log --pretty=format:"%h;%ai;%s" --shortstat
ed6e0ab;2014-01-07 16:32:39 +0530;Foo
3 files changed, 14 insertions(+), 13 deletions(-)
cdfbb10;2014-01-07 14:59:48 +0530;Bar
1 file changed, 21 insertions(+)
5fde3e1;2014-01-06 17:26:40 +0530;Merge Baz
772b277;2014-01-06 17:09:42 +0530;Qux
7 files changed, 72 insertions(+), 7 deletions(-)
Run Code Online (Sandbox Code Playgroud)
我有兴趣让上面的格式像这样显示
ed6e0ab;2014-01-07 16:32:39 +0530;Foo;3;14;13
cdfbb10;2014-01-07 14:59:48 +0530;Bar;1;21;0
5fde3e1;2014-01-06 17:26:40 +0530;Merge Baz;0;0;0
772b277;2014-01-06 17:09:42 +0530;Qux;7;72;7
Run Code Online (Sandbox Code Playgroud)
这将在某些报告中使用,该报告可以解析以分号分隔的值.事情是文本"\n 3 files changed, 14 insertions(+), 13 deletions(-)"(包括新行)被转换为3;14;13(没有新行)一个可能的角落案例是文本"5fde3e1;2014-01-06 17:26:40 +0530;Merge Baz",其中没有这样的行.在那种情况下我想要;0;0;0
总体而言,目标是分析一段时间内的文件更改统计信息.我阅读了git日志文档,但找不到任何可以帮助我以这种格式呈现的格式.我提出的最好的是上面提到的命令.
因此,任何可以生成预期格式的命令或shell脚本都会有很大帮助.
谢谢!
应该很简单,但我会发疯的.
给出如下文字:
line number 1
line number 2
line number 2A
line number 3
line number 3A
line number 3B
line number 4
Run Code Online (Sandbox Code Playgroud)
我需要删除行终止符的Java正则表达式,然后新行以空格开头,以便上面的示例文本变为:
line number 1
line number 2line number 2A
line number 3line number 3Aline number 3B
line number 4
Run Code Online (Sandbox Code Playgroud) 我需要帮助使用sed来评论匹配的行和它后面的4行.在文本文件中.
我的文本文件是这样的:
[myprocess-a]
property1=1
property2=2
property3=3
property4=4
[anotherprocess-b]
property1=gffgg
property3=gjdl
property2=red
property4=djfjf
[myprocess-b]
property1=1
property4=4
property2=2
property3=3
Run Code Online (Sandbox Code Playgroud)
我希望在所有带有文本'[myprocess'的行和前面有4行的预期输出前面加上#:
#[myprocess-a]
#property1=1
#property2=2
#property3=3
#property4=4
[anotherprocess-b]
property1=gffgg
property3=gjdl
property2=red
property4=djfjf
#[myprocess-b]
#property1=1
#property4=4
#property2=2
#property3=3
Run Code Online (Sandbox Code Playgroud)
非常感谢您对此的帮助.
这是我正在努力的事情,我希望StackOverflow上的聪明人提供输入.
我正在尝试的是基于组合相同文本页面的各种不良版本来修复文本的功能.基本上,这可以用于将不同的OCR结果组合成一个,其精度高于其中任何一个.
我从一本600,000英文单词的字典开始,这几乎包括法律和医学术语以及常用名称.我已经有了.
然后我有4个版本的文本示例.
像这样的东西:
$text[0] = 'Fir5t text sample is thisline';
$text[1] = 'Fir5t text Smplee is this line.';
$text[2] = 'First te*t sample i this l1ne.';
$text[3] = 'F i r st text s ample is this line.';
Run Code Online (Sandbox Code Playgroud)
我试图结合上面的内容来得到一个看起来像这样的输出:
$text = 'First text sample is this line.';
Run Code Online (Sandbox Code Playgroud)
不要告诉我这是不可能的,因为它肯定不是,非常困难.
我非常感谢任何人对此有任何想法.
谢谢!
我目前的想法:
只检查字典中的单词是行不通的,因为有些空格位于错误的位置,偶尔单词不会出现在字典中.
主要关注的是修复损坏的间距,一旦修复,那么如果存在则可以选择最常出现的字典单词,或者最常出现的非字典单词.
我有这个文字:
$text = "Ba?ka, küskün otomobil kaçt? buraya küskün otomobil neden kaçt?
kaçt? buraya, oraya KISMEN @here #there J.J.Johanson hep.
Danny:Where is mom? I don't know! Café est weiß for 2 €uros.
My 2nd nickname is mike18.";
Run Code Online (Sandbox Code Playgroud)
最近我用这个.
$a1= array_count_values(str_word_count($text, 1, 'ÇçÖö???I???Üü@#é߀1234567890'));
arsort($a1);
Run Code Online (Sandbox Code Playgroud)
您可以查看这个小提琴:http:
//ideone.com/oVUGYa
但是这个解决方案并不能解决所有UTF8问题.我不能将整个UTF8集写入str_word_count作为参数.
所以我创造了这个:
$wordsArray = explode(" ",$text);
foreach ($wordsArray as $k => $w) {
$wordsArray[$k] = str_replace(array(",","."),"",$w);
}
$wordsArray2 = array_count_values($wordsArray);
arsort($wordsArray2);
Run Code Online (Sandbox Code Playgroud)
输出应该是这样的:
Array (
[kaçt?] => 3
[küskün] => 2
[buraya] …Run Code Online (Sandbox Code Playgroud) 我想将包含HTTP响应的文件拆分为两个文件:一个只包含HTTP头,另一个包含消息正文.为此,我需要\r使用shell脚本将文件拆分为第一个空行(或第一行上仅包含CR =' '字符的UNIX工具)上的两个文件.
如何以便携方式(例如使用sed,但没有GNU扩展)这样做?可以假设空行不是文件中的第一行.空行可以得到文件中的任何一个,没有一个或两个; 对我来说没关系.