我目前在Data Warehouse程序员的位置工作,因此必须通过ETL过程放置大量的平面文件.当然在加载文件之前我必须知道它的内容,问题是大多数文件大于1 GB并且我无法使用亲爱的老朋友"notepad"打开它们.开玩笑.我通常使用VIM或Notepad ++,但打开文件仍需要一段时间.我可以使用VIM或其他编辑器对文件执行"部分"读取吗?
PS我知道我可以为文件的"数据样本"编写一个10行内容脚本,但是说服团队成员使用编辑器的功能而不是我编写的脚本会更简单.
感谢您提供的任何见解.
我试图第一次嵌入多线程并遇到一些意想不到的问题,希望你能提供帮助.
这是给我带来麻烦的代码片段:
ArrayList recordsCollection = new ArrayList();
ArrayList batchCollection = null;
int idx = 0;
while(true)
{
// Some code to generate and assign new batchCollection here
recordsCollection.Add(batchCollection);
ThreadPool.QueueUserWorkItem(delegate
{
ProcessCollection(recordsCollection.GetRange(idx, 1));
});
Interlocked.Increment(ref idx);
}
private void ProcessCollection(ArrayList collection)
{
// Do some work on collection here
}
Run Code Online (Sandbox Code Playgroud)
一旦调用了Process Collection方法并且我试图遍历集合,我就会得到"底层列表中的范围无效".
提前致谢!
更新:伙计们,谢谢你们每一个人.通过应用您的建议,我能够大大简化并使其工作.
在Python中,有哪些更好的图像生成库?如果我要实现GOTCHA(例如),从而必须在像素级别操作图像,我的选择是什么?理想情况下,我想将结果图像保存为低分辨率jpeg,但这只是希望,我会满足于任何常见的图像格式.
感谢您的关注.