标签: split

如何在行号处分割文件

我想从特定的行号中拆分一个400k行的长日志文件.

对于这个问题,让我们这个任意数字300k.

是否有一个linux命令允许我这样做(在脚本中)?

我知道split让我按大小或行号分割文件,但这不是我想要的.我想要一个文件中的第一个300k和第二个文件中的最后一个100k.

任何帮助,将不胜感激.谢谢!

再想一想,这将更适合超级用户或serverfault站点.

linux shell split filesplitting

93
推荐指数
1
解决办法
12万
查看次数

如何将没有空格的文本拆分成单词列表?

输入: "tableapplechairtablecupboard..."很多单词

将这样的文本拆分为单词列表并得到的有效算法是什么?

输出: ["table", "apple", "chair", "table", ["cupboard", ["cup", "board"]], ...]

想到的第一件事就是要经历所有可能的单词(从第一个字母开始)并找到最长的单词,继续 position=word_position+len(word)

PS
我们列出了所有可能的单词.
单词"橱柜"可以是"杯子"和"板子",选择最长.
语言:python,但主要的是算法本身.

python algorithm text split

92
推荐指数
6
解决办法
5万
查看次数

我怎么用"." 作为java中String.split()的分隔符

我想要做的是读取.java文件,并选出所有标识符并将它们存储在列表中.我的问题是.split()方法.如果按原样运行此代码,您将获得ArrayOutOfBounds,但是如果您从"."更改分隔符.除此之外,代码有效.但是我需要用"."解析的行.那么我还有另一种方法可以做到这一点吗?

import java.io.BufferedReader;
import java.io.FileNotFoundException;
import java.io.FileReader;
import java.io.IOException;
import java.util.*;


public class MyHash {
    private static String[] reserved = new String[100];
    private static List list = new LinkedList();
    private static List list2 = new LinkedList();

    public static void main (String args[]){
        Hashtable hashtable  = new Hashtable(997);
        makeReserved();
        readFile();
        String line;
        ListIterator itr = list.listIterator();
        int listIndex = 0;
        while (listIndex < list.size()) {

            if (itr.hasNext()){
                line = itr.next().toString();
                //PROBLEM IS HERE!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!!
                String[] words = line.split(".");  //CHANGE THIS AND IT …
Run Code Online (Sandbox Code Playgroud)

java string split

91
推荐指数
3
解决办法
9万
查看次数

用点作为分隔符拆分字符串

我想知道我是否正在.以正确的方式分割字符串?我的代码是:

String[] fn = filename.split(".");
return fn[0];
Run Code Online (Sandbox Code Playgroud)

我只需要字符串的第一部分,这就是我返回第一项的原因.我问,因为我注意到在API中.意味着任何角色,所以现在我被卡住了.

java regex string split

91
推荐指数
6
解决办法
7万
查看次数

为什么在C++中使用比Python更慢的字符串拆分?

我正在尝试将一些代码从Python转换为C++,以便获得一点速度并提高我生锈的C++技能.昨天我感到震惊的是,在Python中,从stdin读取行的简单实现要比C++快得多(参见本文).今天,我终于想出了如何在C++中使用合并分隔符(与python的split()类似的语义)拆分字符串,现在我正在体验似曾相识!我的C++代码需要更长的时间才能完成工作(尽管不是一个数量级,就像昨天的课程一样).

Python代码:

#!/usr/bin/env python
from __future__ import print_function                                            
import time
import sys

count = 0
start_time = time.time()
dummy = None

for line in sys.stdin:
    dummy = line.split()
    count += 1

delta_sec = int(time.time() - start_time)
print("Python: Saw {0} lines in {1} seconds. ".format(count, delta_sec), end='')
if delta_sec > 0:
    lps = int(count/delta_sec)
    print("  Crunch Speed: {0}".format(lps))
else:
    print('')
Run Code Online (Sandbox Code Playgroud)

C++代码:

#include <iostream>                                                              
#include <string>
#include <sstream>
#include <time.h>
#include <vector>

using namespace std;

void split1(vector<string> &tokens, const string …
Run Code Online (Sandbox Code Playgroud)

c++ python string benchmarking split

91
推荐指数
2
解决办法
1万
查看次数

Java将字符串拆分为数组

我需要帮助这个split()方法.我有以下内容String:

String values = "0|0|0|1|||0|1|0|||";
Run Code Online (Sandbox Code Playgroud)

我需要将值放入数组中.有3种可能的字符串:"0","1"和""

我的问题是,当我尝试使用时split():

String[] array = values.split("\\|"); 
Run Code Online (Sandbox Code Playgroud)

我的值只保存到最后0.看起来像"|||"部分 被修剪.我究竟做错了什么?

谢谢

java string split

91
推荐指数
3
解决办法
36万
查看次数

python中有一个函数将一个单词拆分成一个列表吗?

python中有一个函数可以将单词拆分成单个字母列表吗?例如:

s="Word to Split"
Run Code Online (Sandbox Code Playgroud)

要得到

wordlist=['W','o','r','d','','t','o' ....]
Run Code Online (Sandbox Code Playgroud)

python split function

90
推荐指数
3
解决办法
23万
查看次数

Java中的爆炸和内爆(就像PHP一样)

我是Java新手,虽然在PHP方面有很好的经验,并且正在寻找Java中爆炸和内爆(可用PHP)功能的完美替代品.

我用谷歌搜索了同样但对结果不满意.任何人都有我的问题的良好解决方案将不胜感激.

例如:

String s = "x,y,z";
array a = javaExplode(',',s);  //what is javaExplode??
System.out.println(Arrays.toString(a));
Run Code Online (Sandbox Code Playgroud)

期望的输出:

[x, y, z]
Run Code Online (Sandbox Code Playgroud)

java arrays string split

87
推荐指数
4
解决办法
12万
查看次数

Pandas将列表列分成多列

我有一个pandas dataFrame,其中一列如下所示:

In [207]:df2.teams
Out[207]: 
0         [SF, NYG]
1         [SF, NYG]
2         [SF, NYG]
3         [SF, NYG]
4         [SF, NYG]
5         [SF, NYG]
6         [SF, NYG]
7         [SF, NYG]
Run Code Online (Sandbox Code Playgroud)

我需要使用pandas将这列列表拆分为2列,名为team1和team2

python split list dataframe pandas

86
推荐指数
9
解决办法
9万
查看次数

Python在句子上分割文本

我有一个文本文件.我需要一个句子列表.

如何实施?有许多细微之处,例如在缩写中使用点.

我的旧正则表达式很糟糕.

re.compile('(\. |^|!|\?)([A-Z][^;?\.<>@\^&/\[\]]*(\.|!|\?) )',re.M)
Run Code Online (Sandbox Code Playgroud)

python text split

85
推荐指数
9
解决办法
11万
查看次数