问题列表 - 第7951页

sed优化(基于较小数据集的大文件修改)

我必须处理非常大的纯文本文件(超过10千兆字节,是的,我知道这取决于我们应该称之为大的),行很长.

我最近的任务涉及基于另一个文件的数据进行一些行编辑.

数据文件(应该被修改)包含1500000行,每行为例如800个字符长.每一行都是唯一的,只包含一个身份号码,每个身份号码都是唯一的)

修饰符文件例如是1800行长,包含标识号,以及应该在数据文件中修改的数量和日期.

我只是将(使用Vim正则表达式)修改器文件转换为sed,但它的效率非常低.

假设我在数据文件中有这样的一行:

(some 500 character)id_number(some 300 character)
Run Code Online (Sandbox Code Playgroud)

我需要修改300个字符的数据.

基于修饰符文件,我想出了像这样的sed行:

/id_number/ s/^\(.\{650\}\).\{20\}/\1CHANGED_AMOUNT_AND_DATA/
Run Code Online (Sandbox Code Playgroud)

所以我有1800条这样的线.

但我知道,即使在非常快的服务器上,如果我做了

sed -i.bak -f modifier.sed data.file
Run Code Online (Sandbox Code Playgroud)

它非常慢,因为它必须读取每一行的每个模式.

有没有更好的方法?

注意:我不是程序员,从未学过(在学校里)算法.我可以在服务器上使用awk,sed,一个过时的perl版本.

algorithm perl awk sed large-files

8
推荐指数
1
解决办法
2040
查看次数

如何在Windows上的Emacs中保留剪贴板内容?

这是我遇到过几次的情景:

我从其他程序复制一些文本.转到Emacs并进行一些编辑,然后我将文本粘贴/抽出.Cy to yank and voila ...而不是我打算粘贴的文本.然后我意识到当我移动东西时,我使用了像kill这样的命令line和backward-kill-words,那些被杀死的行和单词现在占据了杀戮戒指.但是输入My不会带回原始复制的文本,因此我需要返回原始程序再次复制文本.如果原始程序关闭,甚至最糟糕的是,我完全丢失了复制的文本.

杀戮线等是这样的基本命令(比如几乎击中删除键),虽然我不介意使用这些命令使杀死环变得有点混乱,但我希望我的原始文本保留在某处杀戮戒指让我最终可以通过键入My几次来找到它.在覆盖剪贴板内容之前,如何让Emacs自动将当前剪贴板内容保留到kill-ring中?

emacs elisp

16
推荐指数
1
解决办法
1713
查看次数

如何将索引像素格式图像转换为32位图像?

我有一个图像,我尝试使用Graphics.FromImage(图像)加载到图形对象,但是如果图像具有索引像素格式,则会引发异常.

有没有办法安全地转换索引图像?

更新:感谢Joe提示将旧图像绘制在新图像上,而不是我试图转换它.这很有道理.

.net c# image indexed-image

2
推荐指数
1
解决办法
3695
查看次数

如何让maven将同一个EAR内的战争共同放入EAR根目录?

我们有一个有很多战争的解决方案.从他们都使用冬眠和春天的意义来看,战争是相似的.这意味着我们在每次战争中都有许多相同的罐子.这成为一个问题,因为耳朵的大小开始增长不成比例.

我想使用Maven来计算依赖关系并将多个战争中常见的所有jar放到EAR的根目录中.

我尝试使用j2ee archetype(maven-archetype-j2ee-simple)组织我的项目,但所有的战争仍然与WEB-INF/lib中的依赖项打包在一起.有没有办法让Maven计算公共依赖关系并将它们放到EAR中,就像他在构造war或jar时能够计算所有过渡依赖关系一样?

ear dependencies maven-2 war package

22
推荐指数
2
解决办法
2万
查看次数

groovy静态类

这个文件中的'静态'做了什么,sample.groovy?

static class froob {
}
Run Code Online (Sandbox Code Playgroud)

groovy代码使用'static'或没有它来编译.

groovy

3
推荐指数
1
解决办法
1万
查看次数

CollabNet SVN服务器和VisualSVN服务器一样好吗?

底格里斯河网站

http://subversion.tigris.org/getting.html#windows

有一个链接到另一个svn服务器,称为CollabNet SVN服务器.有人使用它并知道它比VisualSVN服务器更好或更好吗?

svn visualsvn collabnet visualsvn-server

5
推荐指数
1
解决办法
6174
查看次数

将调试器附加到IIS实例

我在XP机器和Visual Studio 2005上安装了IIS 5.1.如何将调试器连接到IIS实例.

顺便说一句:我没有在正在运行的进程中看到IIS进程,或者我可能不知道要查找什么.

c# asp.net debugging visual-studio-2005

74
推荐指数
5
解决办法
8万
查看次数

如何使用LINQ从字符串中选择标记?

我想从字符串中选择一个标记,如果它存在于字符串中,我已经得到了以下内容,但我不确定它为什么不编译:

IList<string> tokens = _animals.Split(';');

Func<string, bool> f1 = str => str.Contains("Dog");
Func<string, Func<string, bool>, string> f2 = str => Equals(f1, true);

var selected = tokens.Select(f2);
Run Code Online (Sandbox Code Playgroud)

干杯

奥利

c# linq

3
推荐指数
1
解决办法
803
查看次数

为什么我无法访问属于其他类型成员的事件的成员?

注意:这是受WebBrowser Event Properties的启发

为什么我能够MulticastDelegate在声明事件但不在其外的类型中访问事件的成员?

例如:

using System;

class Bar
{
    public static event Action evt;
}

class Program
{
    static event Action foo;
    static Bar bar;

    static void Main()
    {
        // this works
        Delegate[] first = foo.GetInvocationList();

        // This does not compile and generates the following
        // error:
        //
        // The event 'Bar.evt' can only appear on the 
        // left hand side of += or -= (except when used 
        // from within the type 'Bar') …
Run Code Online (Sandbox Code Playgroud)

c# events delegates

4
推荐指数
1
解决办法
618
查看次数

使用jQuery拖放后如何获取坐标位置?

使用jQuery拖放后如何获取坐标位置?我想将坐标保存到数据库中,以便下次访问时,该项目将处于该位置.例如,x:520px,y:300px?

编辑:

我是PHP和mysql程序员:)

那里有没有教程?

jquery drag-and-drop position save

39
推荐指数
5
解决办法
11万
查看次数