我是熊猫和蟒蛇的新手.我的输入数据就像
category text
1 hello iam fine. how are you
1 iam good. how are you doing.
inputData= pd.read_csv(Input', sep='\t', names=['category','text'])
X = inputData["text"]
Y = inputData["category"]
Run Code Online (Sandbox Code Playgroud)
这里的Y是熊猫系列对象,我想将其转换为numpy数组.所以我试过.as_matrix
YArray= Y.as_matrix(columns=None)
print YArray
Run Code Online (Sandbox Code Playgroud)
但我得到的输出为[1,1](这是错误的,因为我只有一个列类别和两行).我希望结果为2x1矩阵.
我部署了长时间运行的Storm拓扑。运行了几个小时后,整个拓扑崩溃了。我检查了工作日志,并找到了这些日志。如此说来,zookeeper客户端会话超时并导致重新连接。我怀疑这与我破碎的拓扑有关。现在,我尝试找出导致客户端超时的原因。
2016-02-29T10:34:12.386+0800 o.a.s.z.ClientCnxn [INFO] Client session timed out, have not heard from server in 23789ms for sessionid 0x252f862028c0083, closing socket connection and attempting reconnect
2016-02-29T10:34:12.986+0800 o.a.s.c.f.s.ConnectionStateManager [INFO] State change: SUSPENDED
2016-02-29T10:34:13.059+0800 b.s.cluster [WARN] Received event :disconnected::none: with disconnected Zookeeper.
2016-02-29T10:34:13.197+0800 o.a.s.z.ClientCnxn [INFO] Opening socket connection to server zk-3.cloud.mos/172.16.13.147:2181. Will not attempt to authenticate using SASL (unknown error)
2016-02-29T10:34:13.241+0800 o.a.s.z.ClientCnxn [WARN] Session 0x252f862028c0083 for server null, unexpected error, closing socket connection and attempting reconnect
java.net.ConnectException: Connection refused
at sun.nio.ch.SocketChannelImpl.checkConnect(Native Method) ~[na:1.8.0_31] …
Run Code Online (Sandbox Code Playgroud) 我想用GitPython从指定的提交中复制文件.我到目前为止来到这里:
import git
git = git.Git(REPO_PATH)
git.checkout(COMMIT_HEX_SHA)
fo = open(REPO_PATH + "/foo.txt", "r")
str = fo.read(10);
fo.close()
Run Code Online (Sandbox Code Playgroud)
有用.但是checkout
更改HEAD
和更改文件.是否可以在没有指定提交的情况下复制文件或读取文件checkout
?
我想从游标中读取部分结果,然后在不读取所有结果的情况下关闭它。cursor.close()
raisesInternalError: Unread result found.
是否可以在不遍历所有结果或使用缓冲区选项的情况下关闭游标?
更新:
我的查询获得大约 3000 条记录,我的目标是获得符合某些条件的前几条记录。在迭代部分结果后,我得到了我想要的。然后我想放弃未读的结果。我不使用缓冲区选项,据我所知,它会立即读取所有结果。这个问题不是Python MySQL 连接器的重复- 使用 fetchone 时发现未读结果
def chooseInstrumentsFromOrigin(self, time):
sql = """select symbol, name, total_ratio, outstanding_ratio from market_values
where time = %s order by {captype} asc""".format(captype=self.strategy_data['captype'])
args = [time]
conn = mysql.connector.connect(**mysql_config)
cursor = conn.cursor(dictionary=True)
cursor.execute(sql, args)
# This function will return half way.
symbols = self.chooseInstrumentsFromLeaders(time, cursor)
# I don't want this line!
for i in cursor: pass
cursor.close()
conn.close()
return symbols
Run Code Online (Sandbox Code Playgroud) 我有一个ID
终结者
ID : ([A-Z_]|'\u0100'..'\uFFFE') ([A-Z_0-9]|'\u0100'..'\uFFFE')*;
Run Code Online (Sandbox Code Playgroud)
和要解析的.txt示例文件
?60:=MA(C,60);
Run Code Online (Sandbox Code Playgroud)
我生成了Java和Python2目标,并分别针对示例文件测试每个目标.Java目标可以解析此文件.但Python2目标不能.它抛出token recognition error at: '?'
.我测试了Python2目标与其他有效输入,所有工作除了包含unicode字符.我错过了什么或python目标不支持unicode解析.
java的
mkdir -p java
java -jar /usr/local/lib/antlr-4.5.3-complete.jar TDX.g4 -o ./java
cd ./java
javac TDX*.java
java org.antlr.v4.gui.TestRig TDX prog -gui ../samples/1.txt
Run Code Online (Sandbox Code Playgroud)
python目标生成命令
java -jar /usr/local/lib/antlr-4.5.3-complete.jar -Dlanguage=Python2 TDX.g4 -o ./tdx_py/antlrgen -visitor
Run Code Online (Sandbox Code Playgroud)
python代码
import sys
from antlr4 import *
from tdx_py.antlrgen import TDXLexer, TDXParser
def executefile(file):
input = FileStream(file, encoding='utf-8')
lexer = TDXLexer(input)
stream = CommonTokenStream(lexer)
parser = TDXParser(stream)
tree = parser.prog()
if __name__ == '__main__':
executefile(sys.argv[1])
Run Code Online (Sandbox Code Playgroud) 我请求了一个html文件,我得到了http状态码304。我知道这意味着内容没有被修改。所以浏览器可以使用缓存。但是我注意到在请求时间信息内容下载中使用了 2.63s。
我使用 Chrome 开发工具进行了调试。
既然浏览器有缓存,为什么还要下载内容?
比db.inventory.find().limit(10)
快吗db.inventory.find()
?
我在 mongodb 中有数百万条记录,我想获取某些订单中的前 10 条记录。
我在一个文件中写了两个蜘蛛。当我运行时scrapy runspider two_spiders.py
,只有第一个 Spider 被执行。如何在不将文件拆分为两个文件的情况下运行它们。
two_spiders.py:
import scrapy
class MySpider1(scrapy.Spider):
# first spider definition
...
class MySpider2(scrapy.Spider):
# second spider definition
...
Run Code Online (Sandbox Code Playgroud) 我在Windows中安装了ejabberd.我在ejabberd文档中查了很长时间并检查了ejabberd安装文件夹(我的计算机中的C:\ Program Files\ejabberd-15.09),但没有找到该文件ejabberd.yml
.
我集成了 Celery 来分发任务并使用 Redis 作为结果后端。现在一切正常。但是在运行了一些任务之后,Redis 中充满了已经读取的结果。阅读后如何删除这些结果。
我想要这样的东西:
async_result.get_and_delete()
Run Code Online (Sandbox Code Playgroud) 这个问题困扰了我很久。似乎所有字形图标库都通过这种方式提供了图标,例如Font Awesome。这是将字形放入CSS的唯一方法吗?还是最好的方法?
a:before {
font-family: FontAwesome;
content: "\f095";
}
Run Code Online (Sandbox Code Playgroud)