小编gzc*_*gzc的帖子

将熊猫系列转换为numpy数组

我是熊猫和蟒蛇的新手.我的输入数据就像

category   text
1   hello iam fine. how are you
1   iam good. how are you doing.

inputData= pd.read_csv(Input', sep='\t', names=['category','text'])
X = inputData["text"]
Y = inputData["category"]
Run Code Online (Sandbox Code Playgroud)

这里的Y是熊猫系列对象,我想将其转换为numpy数组.所以我试过.as_matrix

YArray= Y.as_matrix(columns=None)
print YArray
Run Code Online (Sandbox Code Playgroud)

但我得到的输出为[1,1](这是错误的,因为我只有一个列类别和两行).我希望结果为2x1矩阵.

numpy python-2.7 pandas

27
推荐指数
3
解决办法
5万
查看次数

什么会导致Zookeeper客户端会话超时

我部署了长时间运行的Storm拓扑。运行了几个小时后,整个拓扑崩溃了。我检查了工作日志,并找到了这些日志。如此说来,zookeeper客户端会话超时并导致重新连接。我怀疑这与我破碎的拓扑有关。现在,我尝试找出导致客户端超时的原因。

2016-02-29T10:34:12.386+0800 o.a.s.z.ClientCnxn [INFO] Client session timed out, have not heard from server in 23789ms for sessionid 0x252f862028c0083, closing socket connection and attempting reconnect
2016-02-29T10:34:12.986+0800 o.a.s.c.f.s.ConnectionStateManager [INFO] State change: SUSPENDED
2016-02-29T10:34:13.059+0800 b.s.cluster [WARN] Received event :disconnected::none: with disconnected Zookeeper.
2016-02-29T10:34:13.197+0800 o.a.s.z.ClientCnxn [INFO] Opening socket connection to server zk-3.cloud.mos/172.16.13.147:2181. Will not attempt to authenticate using SASL (unknown error)
2016-02-29T10:34:13.241+0800 o.a.s.z.ClientCnxn [WARN] Session 0x252f862028c0083 for server null, unexpected error, closing socket connection and attempting reconnect
java.net.ConnectException: Connection refused
    at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method) ~[na:1.8.0_31] …
Run Code Online (Sandbox Code Playgroud)

apache-storm apache-zookeeper

8
推荐指数
1
解决办法
1万
查看次数

GitPython是否可以在没有签出的情况下从指定的提交中获取文件

我想用GitPython从指定的提交中复制文件.我到目前为止来到这里:

import git
git = git.Git(REPO_PATH)
git.checkout(COMMIT_HEX_SHA)
fo = open(REPO_PATH + "/foo.txt", "r")
str = fo.read(10);
fo.close()
Run Code Online (Sandbox Code Playgroud)

有用.但是checkout更改HEAD和更改文件.是否可以在没有指定提交的情况下复制文件或读取文件checkout

python gitpython

5
推荐指数
1
解决办法
1108
查看次数

Python mysql.connector InternalError:关闭游标时发现未读结果

我想从游标中读取部分结果,然后在不读取所有结果的情况下关闭它。cursor.close()raisesInternalError: Unread result found.是否可以在不遍历所有结果或使用缓冲区选项的情况下关闭游标?

更新:

我的查询获得大约 3000 条记录,我的目标是获得符合某些条件的前几条记录。在迭代部分结果后,我得到了我想要的。然后我想放弃未读的结果。我不使用缓冲区选项,据我所知,它会立即读取所有结果。这个问题不是Python MySQL 连接器的重复- 使用 fetchone 时发现未读结果

def chooseInstrumentsFromOrigin(self, time):
    sql = """select symbol, name, total_ratio, outstanding_ratio from market_values
            where time = %s order by {captype} asc""".format(captype=self.strategy_data['captype'])

    args = [time]

    conn = mysql.connector.connect(**mysql_config)
    cursor = conn.cursor(dictionary=True)
    cursor.execute(sql, args)

    # This function will return half way.
    symbols = self.chooseInstrumentsFromLeaders(time, cursor)

    # I don't want this line!
    for i in cursor: pass

    cursor.close()
    conn.close()

    return symbols
Run Code Online (Sandbox Code Playgroud)

python mysql mysql-connector-python

5
推荐指数
1
解决办法
2万
查看次数

antlr4 python目标无法识别unicode

我有一个ID终结者

ID      : ([A-Z_]|'\u0100'..'\uFFFE') ([A-Z_0-9]|'\u0100'..'\uFFFE')*;
Run Code Online (Sandbox Code Playgroud)

和要解析的.txt示例文件

?60:=MA(C,60);
Run Code Online (Sandbox Code Playgroud)

我生成了Java和Python2目标,并分别针对示例文件测试每个目标.Java目标可以解析此文件.但Python2目标不能.它抛出token recognition error at: '?'.我测试了Python2目标与其他有效输入,所有工作除了包含unicode字符.我错过了什么或python目标不支持unicode解析.

java的

mkdir -p java
java -jar /usr/local/lib/antlr-4.5.3-complete.jar TDX.g4 -o ./java
cd ./java
javac TDX*.java
java org.antlr.v4.gui.TestRig TDX prog -gui ../samples/1.txt
Run Code Online (Sandbox Code Playgroud)

python目标生成命令

java -jar /usr/local/lib/antlr-4.5.3-complete.jar -Dlanguage=Python2 TDX.g4 -o ./tdx_py/antlrgen -visitor
Run Code Online (Sandbox Code Playgroud)

python代码

import sys
from antlr4 import *
from tdx_py.antlrgen import TDXLexer, TDXParser

def executefile(file):
    input = FileStream(file, encoding='utf-8')
    lexer = TDXLexer(input)
    stream = CommonTokenStream(lexer)
    parser = TDXParser(stream)
    tree = parser.prog()


if __name__ == '__main__':
    executefile(sys.argv[1])
Run Code Online (Sandbox Code Playgroud)

python antlr4

5
推荐指数
1
解决办法
267
查看次数

http得到304但仍然下载内容

我请求了一个html文件,我得到了http状态码304。我知道这意味着内容没有被修改。所以浏览器可以使用缓存。但是我注意到在请求时间信息内容下载中使用了 2.63s。

我使用 Chrome 开发工具进行了调试。

既然浏览器有缓存,为什么还要下载内容?

google-chrome

4
推荐指数
2
解决办法
3080
查看次数

mongodb:limit()会提高查询速度吗?

db.inventory.find().limit(10)快吗db.inventory.find()

我在 mongodb 中有数百万条记录,我想获取某些订单中的前 10 条记录。

mongodb

3
推荐指数
1
解决办法
3299
查看次数

Scrapy 将两个蜘蛛放在一个文件中

我在一个文件中写了两个蜘蛛。当我运行时scrapy runspider two_spiders.py,只有第一个 Spider 被执行。如何在不将文件拆分为两个文件的情况下运行它们。

two_spiders.py:

import scrapy

class MySpider1(scrapy.Spider):
    # first spider definition
    ...

class MySpider2(scrapy.Spider):
    # second spider definition
    ...
Run Code Online (Sandbox Code Playgroud)

python scrapy

3
推荐指数
1
解决办法
2652
查看次数

Windows中的ejabberd.yml在哪里?

我在Windows中安装了ejabberd.我在ejabberd文档中查了很长时间并检查了ejabberd安装文件夹(我的计算机中的C:\ Program Files\ejabberd-15.09),但没有找到该文件ejabberd.yml.

ejabberd

2
推荐指数
2
解决办法
1861
查看次数

Celery如何在读取后删除redis中的任务结果

我集成了 Celery 来分发任务并使用 Redis 作为结果后端。现在一切正常。但是在运行了一些任务之后,Redis 中充满了已经读取的结果。阅读后如何删除这些结果。

我想要这样的东西:

async_result.get_and_delete()
Run Code Online (Sandbox Code Playgroud)

python celery

2
推荐指数
1
解决办法
1384
查看次数

为什么在伪元素之前使用:before来显示字形图标?

这个问题困扰了我很久。似乎所有字形图标库都通过这种方式提供了图标,例如Font Awesome。这是将字形放入CSS的唯一方法吗?还是最好的方法?

a:before {
   font-family: FontAwesome;
   content: "\f095";
}
Run Code Online (Sandbox Code Playgroud)

css glyph

1
推荐指数
1
解决办法
963
查看次数