您好我有1000个数据系列,每个系列有1500个点.
它们形成一个(1000x1500)大小的Numpy数组,使用np.zeros((1500,1000))创建,然后填充数据.
现在如果我希望阵列增长到1600 x 1100呢?我是否必须使用hstack和vstack添加数组,还是有更好的方法?
我希望不要更改数组中1000x1500片段中的数据,基本上只添加空白数据(零)添加到底部和右侧.
谢谢.
您好我使用RBloomberg库返回以下数据帧:
> tt <- bdh(conn, secs, "last price", "20110501")
> tt
ticker date last price
1 EURUSD Curncy 2011-05-01 NA
2 EURUSD Curncy 2011-05-02 1.4830
3 EURUSD Curncy 2011-05-03 1.4825
4 EURUSD Curncy 2011-05-04 1.4827
5 EURUSD Curncy 2011-05-05 1.4539
6 EURUSD Curncy 2011-05-06 1.4316
7 EURUSD Curncy 2011-05-07 NA
8 EURUSD Curncy 2011-05-08 NA
9 USDZAR Curncy 2011-05-01 NA
10 USDZAR Curncy 2011-05-02 6.6090
11 USDZAR Curncy 2011-05-03 6.6394
12 USDZAR Curncy 2011-05-04 6.6837
13 USDZAR Curncy 2011-05-05 6.7250 …Run Code Online (Sandbox Code Playgroud) 从下面的数据框中可以看出,RBloomberg返回了周末日期的NA.
如果是周末,我想删除整行.我该怎么做?
我不想使用na.omit,因为这可能会删除工作日行,如果/当我在数据中获得NA时出于正当理由.
ticker date yld_ytm_mid
1 R206 2011-05-11 6.946
2 R206 2011-05-12 6.969
3 R206 2011-05-13 7.071
4 R206 2011-05-14 NA
5 R206 2011-05-15 NA
6 R201 2011-05-11 7.201
7 R201 2011-05-12 7.213
8 R201 2011-05-13 7.323
9 R201 2011-05-14 NA
10 R201 2011-05-15 NA
11 R157 2011-05-11 7.611
12 R157 2011-05-12 7.622
13 R157 2011-05-13 7.718
14 R157 2011-05-14 NA
15 R157 2011-05-15 NA
16 R203 2011-05-11 8.165
17 R203 2011-05-12 8.170
18 R203 2011-05-13 8.279
19 R203 …Run Code Online (Sandbox Code Playgroud) 好吧所以这里是一个微妙的"怪癖"在r as.Date函数转换为带有时区的POSIXct,我想知道它是否是一个bug.
> as.POSIXct("2013-03-29", tz = "Europe/London")
[1] "2013-03-29 GMT"
> as.Date(as.POSIXct("2013-03-29", tz = "Europe/London"))
[1] "2013-03-29"
Run Code Online (Sandbox Code Playgroud)
到目前为止没有问题,但.....
> as.POSIXct("2013-04-01", tz = "Europe/London")
[1] "2013-04-01 BST"
> as.Date(as.POSIXct("2013-04-01", tz = "Europe/London"))
[1] "2013-03-31"
Run Code Online (Sandbox Code Playgroud)
有谁见过这个?这是一个错误还是另一个怪癖?愚人节?
假设我有两个数据帧,我想合并,但是因为行和列重叠而存在冲突.我想传递一个函数来解决冲突,而不是复制行.可以这样做吗?
import numpy as np
import pandas as pd
dates1 = pd.date_range("2014-01-01", periods = 4)
dates2 = pd.date_range("2014-01-03", periods = 4)
cols1 = list("ABCD")
cols2 = list("CDEF")
df1 = pd.DataFrame(np.ones([4, 4], dtype = "bool"), index = dates1, columns = cols1)
df2 = pd.DataFrame(np.zeros([4, 4], dtype = "bool"), index = dates2, columns = cols2)
In [317]: df1
Out[317]:
A B C D
2014-01-01 True True True True
2014-01-02 True True True True
2014-01-03 True True True True
2014-01-04 True True True …Run Code Online (Sandbox Code Playgroud) 我想知道在React中创建动态选择组件的规范方法是什么.我是否必须创建一个单独的组件,根据下面的代码返回选项,以便能够通过每个条目的props自定义值,然后将它们包含在一个单独的选择组件中?
class ListEntry extends React.Component {
render = () => {
return(
<option value={this.props.ovalue}>{this.props.ovalue}</option>
)
}
}
class SomeList extends React.Component {
genstuff = (n) => {
var theEntries = [];
for(var i = 0; i < n; i++) {
theEntries.push(<ListEntry ovalue={Math.random().toString()} />)
};
return(theEntries)
}
render = () => {
var entries = this.genstuff(10);
return(
<select>
{entries}
<ListEntry ovalue="a basic entry"/>
<ListEntry ovalue="another"/>
</select>
)
}
}
Run Code Online (Sandbox Code Playgroud)
是否有另一种"接受"的方式在SomeList组件本身内执行此操作?如果是这样,有什么优点,缺点?
我也使用这种技术(成功)用于svg元素,所以上面的问题也适用:
class SmallCircle extends React.Component {
render = () …Run Code Online (Sandbox Code Playgroud) 我正在使用 R 包 dbplyr 创建一个数据库,使用 RSQLite,但我的数据库在磁盘上的大小为零字节,尽管我写了(和读回)了一个表。这是我的脚本:
library("RSQLite")
library("dbplyr")
library("dplyr")
data(mtcars)
con <- DBI::dbConnect(RSQLite::SQLite(), dbname = "./mtcars.db")
copy_to(con, mtcars, "mtcars")
print(tbl(con, "mtcars"))
Run Code Online (Sandbox Code Playgroud)
但是正如你从最后的 ls -l 看到的,我的数据库大小是 0,即使脚本确实从数据库中读取了 mtcars(所以它在那里)。我想使用数据库文件与另一个程序共享数据,那么如何定期将数据“刷新”到磁盘?
tbrowne@calculon:~/scratch$ R -f dplysqlite.r
R version 3.2.3 (2015-12-10) -- "Wooden Christmas-Tree"
Copyright (C) 2015 The R Foundation for Statistical Computing
Platform: x86_64-pc-linux-gnu (64-bit)
R is free software and comes with ABSOLUTELY NO WARRANTY.
You are welcome to redistribute it under certain conditions.
Type 'license()' or 'licence()' for distribution details.
Natural language support but …Run Code Online (Sandbox Code Playgroud) 我正在从网站matplotlib复制代码并粘贴到Mac OS X终端上的Vim编辑器中:
pylab_examples示例代码:ellipse_demo.py
虽然这在BBEdit中工作正常:
`from pylab import figure, show, rand
from matplotlib.patches import Ellipse
NUM = 250
ells = [Ellipse(xy=rand(2)*10, width=rand(), height=rand(), angle=rand()*360)
for i in xrange(NUM)]
fig = figure()
ax = fig.add_subplot(111, aspect='equal')
for e in ells:
ax.add_artist(e)
e.set_clip_box(ax.bbox)
e.set_alpha(rand())
e.set_facecolor(rand(3))
ax.set_xlim(0, 10)
ax.set_ylim(0, 10)
show()
Run Code Online (Sandbox Code Playgroud)
也就是说,所有代码都已正确对齐.在Vim中它看起来像这样:
from pylab import figure, show, rand
from matplotlib.patches import Ellipse
NUM = 250
ells = [Ellipse(xy=rand(2)*10, width=rand(), height=rand(), angle=rand()*360)
for i in xrange(NUM)]
fig = figure()
ax …Run Code Online (Sandbox Code Playgroud) 通常在调试时输入browser()语句时,我每天都会得到这个.

当我只输入一对时,它重复了一大堆括号.通常我很快就输入"browser()esc:w enter "(不带引号)以便我可以保存并返回到我的R环境,它会暂停一秒钟,然后将所有这些括号括起来.这不是真的一个问题,一个快速撤销将其取出,只是想知道它为什么这样做.我对Vim(触摸打字员)的移动速度太快了.
我在Windows 7上使用Vim 7.3.这是在多台机器上.在所有情况下,我也使用sharpkey映射大写锁定以逃避,我不知道这可能是一个因素.谁看到这个?任何补救措施?
谢谢.
为了完整性,这是我的vimrc文件:
colorscheme clarity
syntax enable
set guifont=Consolas:h10:cANSI
set number
set tabstop=4
set shiftwidth=4
set softtabstop=4
set expandtab
set autoindent
set smarttab
set backspace=indent,eol,start
set nocompatible
set expandtab
filetype plugin on
filetype indent on
set ruler
set cursorline
set noerrorbells
set visualbell
"set guioptions-=m
set guioptions-=T
Run Code Online (Sandbox Code Playgroud) 对于数值问题,先行程序是否先发制人地多任务?
我对Go的精益设计非常感兴趣,速度,但大部分是由于频道是一流的对象.我希望最后一点可以通过他们应该允许的复杂互连模式为大数据启用全新的深度分析算法.
我的问题域需要对流式传入数据进行实时计算绑定分析.数据可以划分为100-1000个"问题",每个问题需要10到1000秒来计算(即它们的粒度是高度可变的).然而,在输出有意义之前,结果必须全部可用,即说有500个问题,并且在我可以使用它们之前必须解决所有500个问题.应用程序必须能够扩展,可能会成千上万(但不太可能成千上万)问题.
鉴于我不太担心数字库支持(大多数这些东西都是自定义的),Go似乎很理想,因为我可以将每个问题映射到goroutine.在我投资学习Go之前,而不是说,朱莉娅,鲁斯特或一种功能性语言(据我所知,没有一个具有一流的渠道,所以对我来说当然处于劣势)我需要知道是否goroutines是正确先发制人多任务.也就是说,如果我在一台功能强大的多核计算机上运行500个计算绑定goroutine,我是否可以期望在所有"问题"中合理地实现负载平衡,或者我是否必须始终合作"收益",1995风格.考虑到问题的可变粒度以及在计算期间我通常不知道需要多长时间的事实,这个问题尤其重要.
如果另一种语言能更好地为我服务,我很高兴听到它,但我要求执行的线程(或执行/协同程序)是轻量级的.例如,Python多处理模块对于我的扩展目标来说太耗费资源.只是先发制人:我确实理解并行性和并发性之间的区别.