小编a_p*_*son的帖子

采样大数据文件

我目前在Data Warehouse程序员的位置工作,因此必须通过ETL过程放置大量的平面文件.当然在加载文件之前我必须知道它的内容,问题是大多数文件大于1 GB并且我无法使用亲爱的老朋友"notepad"打开它们.开玩笑.我通常使用VIM或Notepad ++,但打开文件仍需要一段时间.我可以使用VIM或其他编辑器对文件执行"部分"读取吗?

PS我知道我可以为文件的"数据样本"编写一个10行内容脚本,但是说服团队成员使用编辑器的功能而不是我编写的脚本会更简单.

感谢您提供的任何见解.

text-editor editor flat-file

5
推荐指数
1
解决办法
243
查看次数

.NET并行处理ArrayList

我试图第一次嵌入多线程并遇到一些意想不到的问题,希望你能提供帮助.

这是给我带来麻烦的代码片段:

ArrayList recordsCollection = new ArrayList();
ArrayList batchCollection = null;
int idx = 0;

while(true)
{
  // Some code to generate and assign new batchCollection here
  recordsCollection.Add(batchCollection);

  ThreadPool.QueueUserWorkItem(delegate
  {
    ProcessCollection(recordsCollection.GetRange(idx, 1));
  });
  Interlocked.Increment(ref idx);
}

private void ProcessCollection(ArrayList collection)
{
   // Do some work on collection here
}
Run Code Online (Sandbox Code Playgroud)

一旦调用了Process Collection方法并且我试图遍历集合,我就会得到"底层列表中的范围无效".

提前致谢!

更新:伙计们,谢谢你们每一个人.通过应用您的建议,我能够大大简化并使其工作.

.net c# collections multithreading

3
推荐指数
1
解决办法
1549
查看次数

Python 2D图像生成

在Python中,有哪些更好的图像生成库?如果我要实现GOTCHA(例如),从而必须在像素级别操作图像,我的选择是什么?理想情况下,我想将结果图像保存为低分辨率jpeg,但这只是希望,我会满足于任何常见的图像格式.

感谢您的关注.

python image image-processing

3
推荐指数
1
解决办法
5469
查看次数