小编reo*_*toa的帖子

使用带du的管道来计算stdin的"大小"

我有一个程序,我从文件中加载文本,然后根据其中一个字段过滤它.我感兴趣的是此过滤步骤后的数据大小.

理想情况下,我可以做类似的事情: awk '$2>=10' <myfile | du -

我可以只应用过滤器并将输出保存在某处,在其上调用du,然后删除该文件,但文件非常大,因此写入磁盘可能需要一段时间.

认识到du代表"磁盘使用",我怀疑我会问一些没有意义的东西,考虑到程序是如何工作的.如果有另一个常用的实用程序,请建议它!

linux stdin du

13
推荐指数
2
解决办法
4589
查看次数

有没有办法区分我的Javascript在基于三叉戟的应用程序和Internet Explorer中运行?

我有一个在网络上很多地方运行的第三方脚本.我希望能够告诉我何时在应用程序和浏览器中运行.用户代理并不总是有用.Chrome chrome根据环境提供具有一些不同属性的对象.任何人都知道IE的类似内容吗?

这是针对类似于谷歌分析的产品,可以在许多环境中实施或结束,我试图更好地区分它们.

javascript browser internet-explorer

13
推荐指数
1
解决办法
305
查看次数

Java:尝试使用错误类型作为Map键时的编译器或Eclipse警告

我最近被一个带有密钥类型的Map的bug所困Long,但我试图将它与类型的密钥一起使用String.我基本上有类似的东西:

Map<Long, Object> map;
...
String wrongType;
if (map.containsKey(wrongType)) {
    // Do something
} else {
    // Do something different
}
Run Code Online (Sandbox Code Playgroud)

因为映射中的所有键都是Long类型,所以代码总是执行else块.

由于containsKeyget方法采用类型的参数,因此Object可以接受任何旧类型的对象而不会抱怨.

我的困惑源于这样一个事实:在我们的系统中,同一个实体以两种不同的方式表示(有时作为a Long,有时作为a String); 我不能轻易改变这一点.有没有什么方法可以在开发时而不是在测试期间捕获这样的错误?也许是一个编译器标志或一些Eclipse选项,它更聪明一些我应该使用的方法containsKeyget方法(以及它们的类似物Set...)

java eclipse generics

10
推荐指数
2
解决办法
682
查看次数

为什么我的 pgrep 模式上似乎有一个长度?

我一生都无法弄清楚为什么pgrep不返回我的进程的 PID。然后,在最后一次徒劳的尝试中,我只输入了可执行文件名称的一部分,瞧,那里有 PID。这导致了这个实验:

bash-4.1$ ./test_abcde_12345_vwxyz_67890.sh &
bash-4.1$
bash-4.1$ ps -ef | grep test_abcde_12345_vwxyz_67890
me 16695 21716  0 06:04 /root/dev/pts/2 00:00:00 /bin/bash ./test_abcde_12345_vwxyz_67890.sh
me 16945 22027  0 06:04 /root/dev/pts/3 00:00:00 grep test_abcde_12345_vwxyz_67890
bash-4.1$ pgrep test_abcde_12345_vwxyz_67890
bash-4.1$ pgrep test_abcde_12345_vwxyz_6789
bash-4.1$ pgrep test_abcde_12345_vwxyz_678
bash-4.1$ pgrep test_abcde_12345_vwxyz_67
bash-4.1$ pgrep test_abcde_12345_vwxyz_6
bash-4.1$ pgrep test_abcde_12345_vwxyz_
bash-4.1$ pgrep test_abcde_12345_vwxyz
bash-4.1$ pgrep test_abcde_12345_vwxy
bash-4.1$ pgrep test_abcde_12345_vwx
bash-4.1$ pgrep test_abcde_12345_vw
bash-4.1$ pgrep test_abcde_12345_v
bash-4.1$ pgrep test_abcde_12345_
bash-4.1$ pgrep test_abcde_12345
bash-4.1$ pgrep test_abcde_1234
16695
bash-4.1$ pgrep test_abcde_123
16695 …
Run Code Online (Sandbox Code Playgroud)

bash grep

4
推荐指数
1
解决办法
562
查看次数

在switch语句中重用代码(Java)

我想使用一个switch语句,但我无法在没有重复代码或使用附带if语句的情况下构造它.有没有解决的办法?

我有5个案例,除了其中一个以外的所有案例我都希望执行某个操作.所以switch发表声明,我可以做到:

switch(x) {
case A:
    foo();
    break;
case B:
case C:
case D:
case E:
    bar();
    break;
}
Run Code Online (Sandbox Code Playgroud)

简单.但困难在于我还需要为每个动作执行另一个不同的动作,所以我不能使用案例的跌倒特征.所以我沦落到了

switch(x) {
case A:
    foo();
    baz(0);
    break;
case B:
    bar();
    baz(1);
    break;
case C:
    bar();
    baz(2);
    break;
case D:
    bar();
    baz(3);
    break;
case E:
    bar();
    baz(4);
    break;
}
Run Code Online (Sandbox Code Playgroud)

因为bar()每次不得不重复,这对我来说都是闻到的

switch(x) {
case A:
    baz(0);
    break;
case B:
    baz(1);
    break;
case C:
    baz(2);
    break;
case D:
    baz(3);
    break;
case E:
    baz(4);
    break;
} …
Run Code Online (Sandbox Code Playgroud)

java switch-statement

4
推荐指数
1
解决办法
1228
查看次数

通过在PIG中的同一块内计算的条件值在FOREACH块内过滤

我有一个日志数据集,我需要在失败后过滤掉设备的所有日志条目(Action = 2).

在这个例子中:

EquipId, ScvId, Action, TimeStamp
Ag,01,1,14-01-01 0:00:01
Ag,01,1,14-01-02 0:00:01
Ag,01,2,14-01-03 0:00:01
Ag,01,1,14-01-04 0:00:01
Ag,01,1,14-01-05 0:00:01
Ag,01,2,14-01-06 0:00:01
Ag,01,1,14-01-07 0:00:01
Ra,01,1,14-01-01 0:00:01
Ra,01,1,14-01-02 0:00:01
Ra,01,1,14-01-03 0:00:01
Ra,01,2,14-01-04 0:00:01
Fe,01,2,14-01-03 0:00:01
Fe,01,1,14-01-03 0:00:02
Fe,01,1,14-01-04 0:00:01
Lu,01,1,14-01-05 0:00:01
Lu,01,1,14-01-04 0:00:01
Lu,01,1,14-01-05 0:00:01
Run Code Online (Sandbox Code Playgroud)

预期的产出是

Ag,01,1,14-01-01 0:00:01
Ag,01,1,14-01-02 0:00:01
Ag,01,2,14-01-03 0:00:01
Ra,01,1,14-01-01 0:00:01
Ra,01,1,14-01-02 0:00:01
Ra,01,1,14-01-03 0:00:01
Ra,01,2,14-01-04 0:00:01
Fe,01,2,14-01-03 0:00:01
Lu,01,1,14-01-05 0:00:01
Lu,01,1,14-01-04 0:00:01
Lu,01,1,14-01-05 0:00:01
Run Code Online (Sandbox Code Playgroud)

我试图在一个FOREACH块中编程,如下所示:

rawData = LOAD './test.csv'  USING PigStorage(',') AS (equipId:chararray, svcId:chararray, action:chararray, date:chararray);

equipDataGrp = GROUP …
Run Code Online (Sandbox Code Playgroud)

foreach apache-pig conditional-statements

4
推荐指数
1
解决办法
8037
查看次数

从Python中的Unicode Web Scrape输出ascii文件

我是Python编程的新手.我在我的Python文件中使用以下代码:

import gethtml
import articletext
url = "http://www.thehindu.com/news/national/india-calls-for-resultoriented-steps-at-asem/article5339414.ece"
result = articletext.getArticle(url)
text_file = open("Output.txt", "w")

text_file.write(result)

text_file.close()
Run Code Online (Sandbox Code Playgroud)

该文件articletext.py包含以下代码:

from bs4 import BeautifulSoup
import gethtml
def getArticleText(webtext):
    articletext = ""
    soup = BeautifulSoup(webtext)
    for tag in soup.findAll('p'):
        articletext += tag.contents[0]
    return articletext

def getArticle(url):
    htmltext = gethtml.getHtmlText(url)
    return getArticleText(htmltext)
Run Code Online (Sandbox Code Playgroud)

但是我收到以下错误:

UnicodeEncodeError: 'ascii' codec can't encode character u'\u201c' in position 473: ordinal not in range(128)
To print the result into the output file, what proper code should I write ? …
Run Code Online (Sandbox Code Playgroud)

python unicode

3
推荐指数
1
解决办法
484
查看次数