我必须处理非常大的纯文本文件(超过10千兆字节,是的,我知道这取决于我们应该称之为大的),行很长.
我最近的任务涉及基于另一个文件的数据进行一些行编辑.
数据文件(应该被修改)包含1500000行,每行为例如800个字符长.每一行都是唯一的,只包含一个身份号码,每个身份号码都是唯一的)
修饰符文件例如是1800行长,包含标识号,以及应该在数据文件中修改的数量和日期.
我只是将(使用Vim正则表达式)修改器文件转换为sed,但它的效率非常低.
假设我在数据文件中有这样的一行:
(some 500 character)id_number(some 300 character)
Run Code Online (Sandbox Code Playgroud)
我需要修改300个字符的数据.
基于修饰符文件,我想出了像这样的sed行:
/id_number/ s/^\(.\{650\}\).\{20\}/\1CHANGED_AMOUNT_AND_DATA/
Run Code Online (Sandbox Code Playgroud)
所以我有1800条这样的线.
但我知道,即使在非常快的服务器上,如果我做了
sed -i.bak -f modifier.sed data.file
Run Code Online (Sandbox Code Playgroud)
它非常慢,因为它必须读取每一行的每个模式.
有没有更好的方法?
注意:我不是程序员,从未学过(在学校里)算法.我可以在服务器上使用awk,sed,一个过时的perl版本.
这是我遇到过几次的情景:
我从其他程序复制一些文本.转到Emacs并进行一些编辑,然后我将文本粘贴/抽出.Cy to yank and voila ...而不是我打算粘贴的文本.然后我意识到当我移动东西时,我使用了像kill这样的命令line和backward-kill-words,那些被杀死的行和单词现在占据了杀戮戒指.但是输入My不会带回原始复制的文本,因此我需要返回原始程序再次复制文本.如果原始程序关闭,甚至最糟糕的是,我完全丢失了复制的文本.
杀戮线等是这样的基本命令(比如几乎击中删除键),虽然我不介意使用这些命令使杀死环变得有点混乱,但我希望我的原始文本保留在某处杀戮戒指让我最终可以通过键入My几次来找到它.在覆盖剪贴板内容之前,如何让Emacs自动将当前剪贴板内容保留到kill-ring中?
我有一个图像,我尝试使用Graphics.FromImage(图像)加载到图形对象,但是如果图像具有索引像素格式,则会引发异常.
有没有办法安全地转换索引图像?
更新:感谢Joe提示将旧图像绘制在新图像上,而不是我试图转换它.这很有道理.
我们有一个有很多战争的解决方案.从他们都使用冬眠和春天的意义来看,战争是相似的.这意味着我们在每次战争中都有许多相同的罐子.这成为一个问题,因为耳朵的大小开始增长不成比例.
我想使用Maven来计算依赖关系并将多个战争中常见的所有jar放到EAR的根目录中.
我尝试使用j2ee archetype(maven-archetype-j2ee-simple)组织我的项目,但所有的战争仍然与WEB-INF/lib中的依赖项打包在一起.有没有办法让Maven计算公共依赖关系并将它们放到EAR中,就像他在构造war或jar时能够计算所有过渡依赖关系一样?
这个文件中的'静态'做了什么,sample.groovy?
static class froob {
}
Run Code Online (Sandbox Code Playgroud)
groovy代码使用'static'或没有它来编译.
底格里斯河网站
http://subversion.tigris.org/getting.html#windows
有一个链接到另一个svn服务器,称为CollabNet SVN服务器.有人使用它并知道它比VisualSVN服务器更好或更好吗?
我在XP机器和Visual Studio 2005上安装了IIS 5.1.如何将调试器连接到IIS实例.
顺便说一句:我没有在正在运行的进程中看到IIS进程,或者我可能不知道要查找什么.
我想从字符串中选择一个标记,如果它存在于字符串中,我已经得到了以下内容,但我不确定它为什么不编译:
IList<string> tokens = _animals.Split(';');
Func<string, bool> f1 = str => str.Contains("Dog");
Func<string, Func<string, bool>, string> f2 = str => Equals(f1, true);
var selected = tokens.Select(f2);
Run Code Online (Sandbox Code Playgroud)
干杯
奥利
注意:这是受WebBrowser Event Properties的启发?
为什么我能够MulticastDelegate在声明事件但不在其外的类型中访问事件的成员?
例如:
using System;
class Bar
{
public static event Action evt;
}
class Program
{
static event Action foo;
static Bar bar;
static void Main()
{
// this works
Delegate[] first = foo.GetInvocationList();
// This does not compile and generates the following
// error:
//
// The event 'Bar.evt' can only appear on the
// left hand side of += or -= (except when used
// from within the type 'Bar') …Run Code Online (Sandbox Code Playgroud) 使用jQuery拖放后如何获取坐标位置?我想将坐标保存到数据库中,以便下次访问时,该项目将处于该位置.例如,x:520px,y:300px?
编辑:
我是PHP和mysql程序员:)
那里有没有教程?