小编use*_*440的帖子

在pandas数据框中选择多个列

我有不同列中的数据,但我不知道如何提取它以将其保存在另一个变量中.

index  a   b   c
1      2   3   4
2      3   4   5
Run Code Online (Sandbox Code Playgroud)

我该如何选择'a','b'并保存到DF1?

我试过了

df1 = df['a':'b']
df1 = df.ix[:, 'a':'b']
Run Code Online (Sandbox Code Playgroud)

似乎没有工作.

python select dataframe pandas

938
推荐指数
19
解决办法
196万
查看次数

如何将csv数据文件导入scikit-learn?

根据我的理解,scikit-learn接受(n-sample,n-feature)格式的数据,这是一个2D数组.假设我有表格中的数据......

Stock prices    indicator1    indicator2
2.0             123           1252
1.0             ..            ..
..              .             . 
.
Run Code Online (Sandbox Code Playgroud)

我该如何导入?

python scikit-learn

32
推荐指数
3
解决办法
7万
查看次数

将pandas.tslib.Timestamp转换为datetime python

我有一个df时间序列.我提取了索引,并希望将它们各自转换为datetime.你是怎么做的?我尝试使用pandas.to_datetime(x)但在使用后检查时它不会转换它type()

python pandas

25
推荐指数
3
解决办法
5万
查看次数

闪亮的图表空间分配

下面的示例将4个窗格中的4个组拼接在一起.但问题是他们似乎居住在一个网格中.是否可以控制闪亮输出中的图表大小?(即,当应用程序运行时右侧没有滚动条)我试图控制高度和宽度,但这似乎只能控制网格本身内的图像...任何想法?

谢谢

shinyUI(pageWithSidebar(
  headerPanel("Example"),
  sidebarPanel(   

  ),

  mainPanel(
    tabsetPanel(tabPanel("Main",plotOutput("temp"))

    )#tabsetPanel  

  )#mainPane;

))



shinyServer(function(input, output) {

  output$temp <-renderPlot({
     par(mfrow=c(2,2))
     plot(1:10)
     plot(rnorm(10))
     plot(rnorm(10))
     plot(rnorm(10))
  }, height = 1000, width = 1000)


})
Run Code Online (Sandbox Code Playgroud)

r shiny

23
推荐指数
1
解决办法
1万
查看次数

转换时区pandas数据帧

我有数据:

                             Symbol      bid      ask
Timestamp                                            
2014-01-01 21:55:34.378000  EUR/USD  1.37622  1.37693
2014-01-01 21:55:40.410000  EUR/USD  1.37624  1.37698
2014-01-01 21:55:47.210000  EUR/USD  1.37619  1.37696
2014-01-01 21:55:57.963000  EUR/USD  1.37616  1.37696
2014-01-01 21:56:03.117000  EUR/USD  1.37616  1.37694
Run Code Online (Sandbox Code Playgroud)

时间戳是GMT.有没有办法将其转换为东方?

请注意我这样做:

data.index
Run Code Online (Sandbox Code Playgroud)

我得到输出:

<class 'pandas.tseries.index.DatetimeIndex'>
[2014-01-01 21:55:34.378000, ..., 2014-01-01 21:56:03.117000]
Length: 5, Freq: None, Timezone: None
Run Code Online (Sandbox Code Playgroud)

python pandas

22
推荐指数
3
解决办法
3万
查看次数

R Shiny:并排复选框

我想知道是否可以在UI上并排显示复选框选项.我试过的一些示例代码:

shinyUI(pageWithSidebar(
  headerPanel("Example"),
  sidebarPanel(   
    checkboxInput(inputId = "simOption", label = "Historical Data",value=TRUE),
    checkboxInput(inputId = "simOption2", label = "Historical Data 2",value=TRUE)


  ),

  mainPanel(
tabsetPanel(

  tabPanel("Heatmap",
           plotOutput("temp")
  ),
  tabPanel("About"),

  id="tabs"
)#tabsetPanel  

  )#mainPane;

))
Run Code Online (Sandbox Code Playgroud)

r shiny

11
推荐指数
2
解决办法
6461
查看次数

如何在pandas中读取修复宽度格式文本文件

我刚抓到熊猫,我正在弄清楚如何读取文件.该文件来自WRDS数据库,是一直追溯到20世纪60年代的SP500成分列表.我检查了文件,无论我使用'read_csv'导入它,我仍然无法正确显示数据.

df = read_csv('sp500-sb.txt')

df

<class 'pandas.core.frame.DataFrame'>
Int64Index: 1231 entries, 0 to 1230
Data columns: gvkeyx      from      thru     conm
                                        gvkey      co_conm
...(the column names)
dtypes: object(1)
Run Code Online (Sandbox Code Playgroud)

上面的输出块是什么意思?什么都有帮助

python pandas

10
推荐指数
2
解决办法
1万
查看次数

Rollapply为时间序列

我试图计算滚动的20期历史波动率.我拿每日回报:

ret<-ROC(data1)
Run Code Online (Sandbox Code Playgroud)

然后我使用rollapply为每列获得20天的HV:

vol<-rollapply(ret,20,sd,by.column=T,fill=NA)
Run Code Online (Sandbox Code Playgroud)

问题是vol中的观察开始在十天之后出现,这是我指定的错误20.

为了演示,这里有数据样本:

0.000000000, 0.005277045, 0.023622047, 0.002564103,-0.002557545, -0.020512821,
0.007853403,-0.012987013,  0.007894737,  0.015665796,  0.000000000, -0.002570694,
0.002577320, -0.015424165, 0.002610966,  0.010416667,  0.002577320,  0.015424165, 
0.000000000, -0.002531646, -0.002538071, 0.030534351,  0.014814815, -0.007299270,
-0.009803922, -0.012376238,  0.002506266, -0.015000000,-0.002538071,  0.002544529
Run Code Online (Sandbox Code Playgroud)

假设上面的数据存储在x中,然后:

rollapply(x,20,sd,fill=NA)
Run Code Online (Sandbox Code Playgroud)

将在第10行而不是20处产生第一次观察.此外,sd也是错误的.

我应该在这里遗漏一些东西......

r zoo

10
推荐指数
2
解决办法
2万
查看次数

如何检查包含NaN的列表

在我的for循环中,我的代码生成了一个像这样的列表:

list([0.0,0.0]/sum([0.0,0.0]))
Run Code Online (Sandbox Code Playgroud)

循环生成所有类型的其他数字向量,但它也生成[nan,nan],并且为了避免它我试图放入条件以防止它像下面的那个,但它不会返回true.

nan in list([0.0,0.0]/sum([0.0,0.0]))
>>> False
Run Code Online (Sandbox Code Playgroud)

它不应该归还吗?

在此输入图像描述

我加载的库:

import PerformanceAnalytics as perf
import DataAnalyticsHelpers
import DataHelpers as data
import OptimizationHelpers as optim
from matplotlib.pylab import *
from pandas.io.data import DataReader
from datetime import datetime,date,time
import tradingWithPython as twp
import tradingWithPython.lib.yahooFinance as data_downloader # used to get data from yahoo finance
import pandas as pd # as always.
import numpy as np
import zipline as zp
from scipy.optimize import minimize
from itertools import product, combinations
import time …
Run Code Online (Sandbox Code Playgroud)

python

10
推荐指数
2
解决办法
4万
查看次数

警告消息行号R.

我有一个很大的for循环循环数百次,最后会产生这个警告:

Warning messages:
1: In min(j, na.rm = TRUE) :
  no non-missing arguments to min; returning Inf
Run Code Online (Sandbox Code Playgroud)

有什么办法我可以问R生成警告信息的哪一行?


OP的评论如下:"我不直接将min作为一条线.它可能嵌套在其他函数中,我不会问这个问题,因为我知道这是来自min的问题."

r

9
推荐指数
1
解决办法
2987
查看次数

标签 统计

python ×6

pandas ×4

r ×4

shiny ×2

dataframe ×1

scikit-learn ×1

select ×1

zoo ×1