小编cra*_*liv的帖子

将大文件(> = 7 GB)合并为一种快速方法

我有三个巨大的文件,只有2列,我需要两个.我想将它们合并到一个文件中,然后我可以将其写入SQLite数据库.

我使用Python并完成了工作,但是花了大约30分钟,我的系统还挂了10个.我想知道是否有更快的方法使用awk或任何其他unix工具.Python中更快的方式也会很棒.代码如下:

'''We have tweets of three months in 3 different files.
Combine them to a single file '''
import sys, os
data1 = open(sys.argv[1], 'r')
data2 = open(sys.argv[2], 'r')
data3 = open(sys.argv[3], 'r')
data4 = open(sys.argv[4], 'w')
for line in data1:
    data4.write(line)
data1.close()
for line in data2:
    data4.write(line)
data2.close()
for line in data3:
    data4.write(line)
data3.close()
data4.close()
Run Code Online (Sandbox Code Playgroud)

python io

5
推荐指数
1
解决办法
3513
查看次数

Selenium 2 WebDriver无法找到链接

我看到了有关类似/相同问题的其他问题但他们没有帮助我解决问题:(.我登录到生产网站.说(http://www.site.com/log).我想点击一个之后的链接,但Selenium无法找到链接.相关的HTML部分是:

<div style="display:none" id="managers">
             <a class="projectManager" style="color:black"> Project Manager</a>

             <a class="transportManager"> Transport Manager</a>
         </div>
Run Code Online (Sandbox Code Playgroud)

java代码如下:

import java.util.regex.Pattern;
import java.util.concurrent.TimeUnit;
import org.junit.*;
import static org.junit.Assert.*;
import static org.hamcrest.CoreMatchers.*;
import org.openqa.selenium.*;
import org.openqa.selenium.chrome.ChromeDriver;
import org.openqa.selenium.firefox.FirefoxDriver;
import org.openqa.selenium.remote.DesiredCapabilities;
import org.openqa.selenium.support.ui.Select;

public class test {
    private WebDriver driver;
    private String baseUrl="";
    private StringBuffer verificationErrors = new StringBuffer();
    @Before
    public void setUp() throws Exception {
        //driver = new FirefoxDriver();
        //driver.manage().timeouts().implicitlyWait(45, TimeUnit.SECONDS);
        DesiredCapabilities chromeCapabilities = DesiredCapabilities.chrome();

        String chromeBinary = System.getProperty(" ");
        if (chromeBinary == …
Run Code Online (Sandbox Code Playgroud)

java eclipse selenium

3
推荐指数
1
解决办法
1万
查看次数

AWS实例私有IP在停止/重新启动后发生变化(之前没有发生过)

是的,我在这里读到了 Eric Hammond 的一篇文章,他提到私有 IP 在重新启动时也会改变。几个月前,当我第一次为hadoop建立AWS集群时,我使用内部IP来配置/etc/hosts,并且内部IP不会改变(即使实例停止,我也可以看到内部IP) 。

为了将该集群复制为我们公司帐户的一部分,我创建了一些 AMI 并使用它们来启动实例。现在,每次重新启动计算机时,IP 都会发生变化。

检查没有更改IP的机器,似乎没有什么特别的地方。它们是相同的简单 EBS 支持的带有卷的实例。嗯,那么它们之间有什么区别呢?

hadoop amazon-ec2 amazon-web-services

3
推荐指数
1
解决办法
1121
查看次数

附加列表 - 分段错误

我试图将一个列表附加到另一个列表中.如果我传递两个列表的指针指针并只显示它们,那么代码工作正常.但是如果我使用代码到达第一个列表的NULL指针,然后将它等同于第二个列表中的第一个,那么它会给出一个分段错误.请让我知道错误是什么.代码如下:

#include<stdio.h>
#include<stdlib.h>
struct node 
{
    int data;
    struct node* next;
}*Head,*New;
void display(struct node **p)
{
    struct node *curptr;
    curptr=*p;
    if(curptr==NULL)
        printf("list is empty");
    else
    {
        while(curptr)
        {
            printf("->%d",curptr->data);
            curptr=curptr->next;
        }
    }
}
void combine(struct node **a,struct node **b)
{
    //display(&(*a));
    struct node *aptr;
    aptr=*a;
    while(aptr)
        aptr=aptr->next;
    aptr->next=*b;
    *b=NULL;
    display(&(*a));

    //display(&(*a));
    //display(&(*b));   

}
void main()
{
    Head=NULL;
    New=NULL;
    int choice;
    while(1)
    {
          case 9:
        {
            printf("Combining two lists");
            combine(&Head,&New);
            break;
        }
Run Code Online (Sandbox Code Playgroud)

c linked-list segmentation-fault

1
推荐指数
1
解决办法
121
查看次数