我有一个程序,我从文件中加载文本,然后根据其中一个字段过滤它.我感兴趣的是此过滤步骤后的数据大小.
理想情况下,我可以做类似的事情: awk '$2>=10' <myfile | du -
我可以只应用过滤器并将输出保存在某处,在其上调用du,然后删除该文件,但文件非常大,因此写入磁盘可能需要一段时间.
认识到du代表"磁盘使用",我怀疑我会问一些没有意义的东西,考虑到程序是如何工作的.如果有另一个常用的实用程序,请建议它!
我有一个在网络上很多地方运行的第三方脚本.我希望能够告诉我何时在应用程序和浏览器中运行.用户代理并不总是有用.Chrome chrome根据环境提供具有一些不同属性的对象.任何人都知道IE的类似内容吗?
这是针对类似于谷歌分析的产品,可以在许多环境中实施或结束,我试图更好地区分它们.
我最近被一个带有密钥类型的Map的bug所困Long,但我试图将它与类型的密钥一起使用String.我基本上有类似的东西:
Map<Long, Object> map;
...
String wrongType;
if (map.containsKey(wrongType)) {
// Do something
} else {
// Do something different
}
Run Code Online (Sandbox Code Playgroud)
因为映射中的所有键都是Long类型,所以代码总是执行else块.
由于containsKey和get方法采用类型的参数,因此Object可以接受任何旧类型的对象而不会抱怨.
我的困惑源于这样一个事实:在我们的系统中,同一个实体以两种不同的方式表示(有时作为a Long,有时作为a String); 我不能轻易改变这一点.有没有什么方法可以在开发时而不是在测试期间捕获这样的错误?也许是一个编译器标志或一些Eclipse选项,它更聪明一些我应该使用的方法containsKey和get方法(以及它们的类似物Set...)
我一生都无法弄清楚为什么pgrep不返回我的进程的 PID。然后,在最后一次徒劳的尝试中,我只输入了可执行文件名称的一部分,瞧,那里有 PID。这导致了这个实验:
bash-4.1$ ./test_abcde_12345_vwxyz_67890.sh &
bash-4.1$
bash-4.1$ ps -ef | grep test_abcde_12345_vwxyz_67890
me 16695 21716 0 06:04 /root/dev/pts/2 00:00:00 /bin/bash ./test_abcde_12345_vwxyz_67890.sh
me 16945 22027 0 06:04 /root/dev/pts/3 00:00:00 grep test_abcde_12345_vwxyz_67890
bash-4.1$ pgrep test_abcde_12345_vwxyz_67890
bash-4.1$ pgrep test_abcde_12345_vwxyz_6789
bash-4.1$ pgrep test_abcde_12345_vwxyz_678
bash-4.1$ pgrep test_abcde_12345_vwxyz_67
bash-4.1$ pgrep test_abcde_12345_vwxyz_6
bash-4.1$ pgrep test_abcde_12345_vwxyz_
bash-4.1$ pgrep test_abcde_12345_vwxyz
bash-4.1$ pgrep test_abcde_12345_vwxy
bash-4.1$ pgrep test_abcde_12345_vwx
bash-4.1$ pgrep test_abcde_12345_vw
bash-4.1$ pgrep test_abcde_12345_v
bash-4.1$ pgrep test_abcde_12345_
bash-4.1$ pgrep test_abcde_12345
bash-4.1$ pgrep test_abcde_1234
16695
bash-4.1$ pgrep test_abcde_123
16695 …Run Code Online (Sandbox Code Playgroud) 我想使用一个switch语句,但我无法在没有重复代码或使用附带if语句的情况下构造它.有没有解决的办法?
我有5个案例,除了其中一个以外的所有案例我都希望执行某个操作.所以switch发表声明,我可以做到:
switch(x) {
case A:
foo();
break;
case B:
case C:
case D:
case E:
bar();
break;
}
Run Code Online (Sandbox Code Playgroud)
简单.但困难在于我还需要为每个动作执行另一个不同的动作,所以我不能使用案例的跌倒特征.所以我沦落到了
switch(x) {
case A:
foo();
baz(0);
break;
case B:
bar();
baz(1);
break;
case C:
bar();
baz(2);
break;
case D:
bar();
baz(3);
break;
case E:
bar();
baz(4);
break;
}
Run Code Online (Sandbox Code Playgroud)
因为bar()每次不得不重复,这对我来说都是闻到的
switch(x) {
case A:
baz(0);
break;
case B:
baz(1);
break;
case C:
baz(2);
break;
case D:
baz(3);
break;
case E:
baz(4);
break;
} …Run Code Online (Sandbox Code Playgroud) 我有一个日志数据集,我需要在失败后过滤掉设备的所有日志条目(Action = 2).
在这个例子中:
EquipId, ScvId, Action, TimeStamp
Ag,01,1,14-01-01 0:00:01
Ag,01,1,14-01-02 0:00:01
Ag,01,2,14-01-03 0:00:01
Ag,01,1,14-01-04 0:00:01
Ag,01,1,14-01-05 0:00:01
Ag,01,2,14-01-06 0:00:01
Ag,01,1,14-01-07 0:00:01
Ra,01,1,14-01-01 0:00:01
Ra,01,1,14-01-02 0:00:01
Ra,01,1,14-01-03 0:00:01
Ra,01,2,14-01-04 0:00:01
Fe,01,2,14-01-03 0:00:01
Fe,01,1,14-01-03 0:00:02
Fe,01,1,14-01-04 0:00:01
Lu,01,1,14-01-05 0:00:01
Lu,01,1,14-01-04 0:00:01
Lu,01,1,14-01-05 0:00:01
Run Code Online (Sandbox Code Playgroud)
预期的产出是
Ag,01,1,14-01-01 0:00:01
Ag,01,1,14-01-02 0:00:01
Ag,01,2,14-01-03 0:00:01
Ra,01,1,14-01-01 0:00:01
Ra,01,1,14-01-02 0:00:01
Ra,01,1,14-01-03 0:00:01
Ra,01,2,14-01-04 0:00:01
Fe,01,2,14-01-03 0:00:01
Lu,01,1,14-01-05 0:00:01
Lu,01,1,14-01-04 0:00:01
Lu,01,1,14-01-05 0:00:01
Run Code Online (Sandbox Code Playgroud)
我试图在一个FOREACH块中编程,如下所示:
rawData = LOAD './test.csv' USING PigStorage(',') AS (equipId:chararray, svcId:chararray, action:chararray, date:chararray);
equipDataGrp = GROUP …Run Code Online (Sandbox Code Playgroud) 我是Python编程的新手.我在我的Python文件中使用以下代码:
import gethtml
import articletext
url = "http://www.thehindu.com/news/national/india-calls-for-resultoriented-steps-at-asem/article5339414.ece"
result = articletext.getArticle(url)
text_file = open("Output.txt", "w")
text_file.write(result)
text_file.close()
Run Code Online (Sandbox Code Playgroud)
该文件articletext.py包含以下代码:
from bs4 import BeautifulSoup
import gethtml
def getArticleText(webtext):
articletext = ""
soup = BeautifulSoup(webtext)
for tag in soup.findAll('p'):
articletext += tag.contents[0]
return articletext
def getArticle(url):
htmltext = gethtml.getHtmlText(url)
return getArticleText(htmltext)
Run Code Online (Sandbox Code Playgroud)
但是我收到以下错误:
UnicodeEncodeError: 'ascii' codec can't encode character u'\u201c' in position 473: ordinal not in range(128)
To print the result into the output file, what proper code should I write ? …Run Code Online (Sandbox Code Playgroud)