小编Ist*_*van的帖子

如何使用`awk`打印正则表达式匹配?

有没有办法awk在shell中使用命令打印正则表达式匹配(但只有匹配的字符串)?

bash shell awk

35
推荐指数
2
解决办法
6万
查看次数

使用不同的参数和默认值在Ruby中初始化类的最有效方法是什么?

我希望有一个类和一些属性,您可以在初始化期间设置或使用其默认值.

class Fruit
  attr_accessor :color, :type
  def initialize(color, type)
    @color=color ||= 'green'
    @type=type ||='pear'
  end
end

apple=Fruit.new(red, apple)
Run Code Online (Sandbox Code Playgroud)

ruby oop class

29
推荐指数
5
解决办法
3万
查看次数

如何用Pandas读取UTF-8文件?

我有一个带有twitter数据的UTF-8文件,我试图将它读入Python数据框但我只能得到一个'对象'类型而不是unicode字符串:

# file 1459966468_324.csv
#1459966468_324.csv: UTF-8 Unicode English text
df = pd.read_csv('1459966468_324.csv', dtype={'text': unicode})
df.dtypes
text               object
Airline            object
name               object
retweet_count     float64
sentiment          object
tweet_location     object
dtype: object
Run Code Online (Sandbox Code Playgroud)

使用Pandas读取和强制UTF-8数据到unicode的正确方法是什么?

这并没有解决问题:

df = pd.read_csv('1459966468_324.csv', encoding = 'utf8')
df.apply(lambda x: pd.lib.infer_dtype(x.values))
Run Code Online (Sandbox Code Playgroud)

文本文件在这里:https: //raw.githubusercontent.com/l1x/nlp/master/1459966468_324.csv

python csv utf-8 pandas

17
推荐指数
2
解决办法
6万
查看次数

为什么G1 Full GC被不必要地触发?

我在用

java version "1.7.0_09"
Java(TM) SE Runtime Environment (build 1.7.0_09-b05)
Java HotSpot(TM) 64-Bit Server VM (build 23.5-b02, mixed mode)
Run Code Online (Sandbox Code Playgroud)

与G1垃圾收集器.JVM的论点是

-server -Xss4096k -XX:MaxPermSize=512m -XX:PermSize=512m -Xms30G 
-Xmx30G -Xnoclassgc -XX:+UseNUMA -XX:+UseFastAccessorMethods 
-XX:ReservedCodeCacheSize=48m -XX:+UseStringCache 
-XX:+UseGCOverheadLimit -Duser.timezone=EET 
-Xmaxf1 -XX:+UseCompressedOops -XX:+DisableExplicitGC 
-XX:+AggressiveOpts -XX:CMSInitiatingOccupancyFraction=70 
-XX:+ParallelRefProcEnabled -XX:+UseAdaptiveSizePolicy 
-XX:MaxGCPauseMillis=500 -XX:+UseG1GC 
-XX:InitiatingHeapOccupancyPercent=0 
-XX:GCPauseIntervalMillis=10000 -XX:+PrintGCDetails 
-XX:+PrintHeapAtGC -XX:+PrintGCDateStamps -Xloggc:gc.log
Run Code Online (Sandbox Code Playgroud)

但是,我正在经历完全GC扫描,没有任何明显的原因,如何摆脱它们?

GC日志与之前事件的尾部:

{Heap before GC invocations=206 (full 8):
 garbage-first heap   total 31457280K, used 18323299K [0x00007fc6eb800000, 0x00007fce6b800000, 0x00007fce6b800000)
  region size 8192K, 768 young (6291456K), 31 survivors (253952K)
 compacting perm gen  total 524288K, used …
Run Code Online (Sandbox Code Playgroud)

java garbage-collection g1gc

15
推荐指数
2
解决办法
7592
查看次数

如何使用Ruby加密文件?

我需要编写一个加密/解密文件的简单工具.

我想最好的方法是使用OpenSSL:

生成密钥:

openssl rand -base64 2048 > secret_key
Run Code Online (Sandbox Code Playgroud)

加密文件:

openssl aes-256-cbc -a -e -in file -out file.enc -k secret_key
Run Code Online (Sandbox Code Playgroud)

解密文件:

openssl aes-256-cbc -d -in file.enc -out file -k secret_key
Run Code Online (Sandbox Code Playgroud)

有没有一种简单的方法在Ruby中实现它?有没有更好的方法呢?使用PGP可能吗?

ruby security encryption openssl

11
推荐指数
1
解决办法
1万
查看次数

如何将目录添加到Clojure的类路径?

我已经将Maven的库安装到〜/ .m2/repository /目录中.我想将该路径添加到默认的Clojure类路径.我找不到文档如何做到这一点.

任何提示?

干杯!

clj
Clojure 1.4.0
user=> (require '[clojure.java.jmx :as jmx])
FileNotFoundException Could not locate clojure/java/jmx__init.class or clojure/java/jmx.clj on classpath:   clojure.lang.RT.load (RT.java:432)
Run Code Online (Sandbox Code Playgroud)

默认情况下,类路径为:

user=> (println (seq (.getURLs (java.lang.ClassLoader/getSystemClassLoader))))
(#<URL file:/Users/myuser/cljmx/> #<URL file:/usr/local/Cellar/clojure/1.4.0/clojure-1.4.0.jar> #<URL file:/Users/myuser/cljmx/>)
nil
Run Code Online (Sandbox Code Playgroud)

java clojure

10
推荐指数
4
解决办法
2万
查看次数

如何使用Ansible的iam_module获取访问密钥?

我正在使用Ansible来创建AWS用户.Ansible的一个功能是创建一个具有访问密钥的用户.我想知道如何在用户成功创建后获取访问密钥.

http://docs.ansible.com/ansible/iam_module.html

tasks:
- name: Create two new IAM users with API keys
  iam:
    iam_type: user
    name: "{{ item }}"
    state: present
    password: "{{ temp_pass }}"
    access_key_state: create
  with_items:
    - user
Run Code Online (Sandbox Code Playgroud)

amazon-web-services amazon-iam ansible

8
推荐指数
2
解决办法
1887
查看次数

通过Python中的正则表达式从列表中删除元素

我试图从 Python 中的列表中删除括号中的字符串,但没有成功。

请参阅以下代码:

full = ['webb', 'ellis', '(sportswear)']
regex = re.compile(r'\b\(.*\)\b')
filtered = [i for i in full if not regex.search(i)]
Run Code Online (Sandbox Code Playgroud)

返回:

['webb', 'ellis', '(sportswear)']
Run Code Online (Sandbox Code Playgroud)

有人能指出我的错误吗?

python regex

8
推荐指数
1
解决办法
1万
查看次数

如何在Clojure中将JSON打印到文件?

我想将JSON内容存储在文件中但使用漂亮的版本.

为了清楚起见,这是正常的JSON:

{"b":2, "a":1}
Run Code Online (Sandbox Code Playgroud)

这是它的漂亮版本:

{
    "b": 2,
    "a": 1
}
Run Code Online (Sandbox Code Playgroud)

在Clojure中有没有办法实现这一目标?

json clojure pretty-print

7
推荐指数
2
解决办法
2199
查看次数

如何使用Solr索引哈希数组

我需要索引具有以下数据结构的专利目录:

  "cpc": [
    {
      "class": "61",
      "section": "A",
      "sequence": "1",
      "subclass": "K",
      "subgroup": "06",
      "main-group": "45",
      "classification-value": "I"
    },
    {
      "class": "61",
      "section": "A",
      "sequence": "2",
      "subclass": "K",
      "subgroup": "506",
      "main-group": "31",
      "classification-value": "I"
    }
]
Run Code Online (Sandbox Code Playgroud)

我想知道这里的正确方法是什么.我或许可以使用cpc.class并将其与multiValued ="true"结合使用.

我想查找与某个CPC代码匹配的文档.CPC代码可以是部分代码.现在我的解决方案只是使用multiValued = true的嵌套引用.有没有更好的方法呢?

<field name="cpc.class"                 type="int"    indexed="true" stored="true" multiValued="true" />
<field name="cpc.section"               type="string" indexed="true" stored="true" multiValued="true" />
<field name="cpc.sequence"              type="int"    indexed="true" stored="true" multiValued="true" />
<field name="cpc.subclass"              type="string" indexed="true" stored="true" multiValued="true" />
<field name="cpc.subgroup"              type="int"    indexed="true" stored="true" multiValued="true" />
<field name="cpc.main-group"            type="int"    indexed="true" …
Run Code Online (Sandbox Code Playgroud)

indexing json solr

7
推荐指数
1
解决办法
685
查看次数