小编Joh*_*ohn的帖子

按列名从pandas DataFrame中删除列

删除DataFrame中的列时,我使用:

del df['column_name']
Run Code Online (Sandbox Code Playgroud)

这很有效.为什么我不能使用以下?

del df.column_name
Run Code Online (Sandbox Code Playgroud)

由于您可以访问列/系列df.column_name,我希望这可以工作.

python dataframe pandas

1136
推荐指数
15
解决办法
150万
查看次数

更改IPython/Jupyter笔记本工作目录

当我打开一个Jupyter笔记本(以前称为IPython)时,默认为C:\Users\USERNAME.

如何将其更改为其他位置?

谢谢.

ipython jupyter jupyter-notebook

188
推荐指数
16
解决办法
33万
查看次数

Pandas数据帧中的随机行选择

有没有办法从Pandas中的DataFrame中选择随机行.

在R中,使用汽车包,有一个some(x, n)类似于头部的有用功能,但在这个例子中,从x中随机选择10行.

我也查看了切片文档,似乎没有任何等价物.

更新

现在使用版本20.有一个示例方法.

df.sample(n)

python pandas

140
推荐指数
5
解决办法
9万
查看次数

Anaconda vs. EPD Enthought与Python的手动安装

各种Python捆绑包(EPD/Anaconda)与手动安装的相对优点/缺点是什么?

我已经安装了EPD学术,我没有任何问题.它提供了我认为我将需要的更多软件包,并且使用enpkg enstaller进行更新非常容易.EPD学术许可证要求每年续订,免费版本不会轻易更新.

目前我真的只使用一些软件包,如Pandas,NumPy,SciPy,matplotlib,IPython,Statsmodels及其各自的依赖项.

对于这种有限的使用我最好手动安装,pip install --upgrade 'package'或者捆绑包提供超出此范围的任何东西?

python epd-python anaconda

110
推荐指数
2
解决办法
6万
查看次数

计算字符串中所有单词的数量

是否有一个函数来计算字符串中的单词数?例如:

str1 <- "How many words are in this sentence"
Run Code Online (Sandbox Code Playgroud)

返回7的结果.

string r word-count

71
推荐指数
13
解决办法
8万
查看次数

提取回归系数值

我有一个回归模型的一些时间序列数据调查药物利用率.目的是将样条拟合到时间序列并计算95%CI等.模型如下:

id <- ts(1:length(drug$Date))
a1 <- ts(drug$Rate)
a2 <- lag(a1-1)
tg <- ts.union(a1,id,a2)
mg <-lm (a1~a2+bs(id,df=df1),data=tg) 
Run Code Online (Sandbox Code Playgroud)

摘要输出mg是:

Call:
lm(formula = a1 ~ a2 + bs(id, df = df1), data = tg)

Residuals:
     Min       1Q   Median       3Q      Max 
-0.31617 -0.11711 -0.02897  0.12330  0.40442 

Coefficients:
                  Estimate Std. Error t value Pr(>|t|)    
(Intercept)        0.77443    0.09011   8.594 1.10e-11 ***
a2                 0.13270    0.13593   0.976  0.33329    
bs(id, df = df1)1 -0.16349    0.23431  -0.698  0.48832    
bs(id, df = df1)2  0.63013    0.19362   3.254  0.00196 ** 
bs(id, …
Run Code Online (Sandbox Code Playgroud)

regression r lm

66
推荐指数
3
解决办法
16万
查看次数

用Python导入模块 - 最佳实践

我是Python的新手,因为我想扩展我使用R学习的技能.在RI中,往往会加载一堆库,有时会导致函数名称冲突.

什么是Python的最佳实践.我看到一些具体的变化,我没有看到它们之间的区别

import pandas,from pandas import *from pandas import DataFrame

前两个之间有什么区别,我应该只输入我需要的东西.此外,对于制作小程序来处理数据和计算简单统计数据的人来说,最糟糕的后果是什么.

UPDATE

我找到了这个出色的指南.它解释了一切.

python workflow coding-style python-import

59
推荐指数
5
解决办法
3万
查看次数

表中的边际总数

我有一个数据框,在不同的日期从临床分离株中发现了许多感染.

到目前为止,我已将数据组织成我想要开始使用的形状.我正在尝试为报告的描述性统计准备一系列表格表.

我一直在使用ftable并获得以下内容:

onset.types <- ftable(SAB$Onset,SAB$MRSA.Type,year(SAB$Collection.Date))
                             2005 2006 2007 2008 2009 2010

Community                     454  472  512  499  525  512
          AUS-2/3-like         28   23   27   29   32   38
          EMRSA-15-like         9    4    4    9    8    8
          nmMRSA               40   47   53   39   64   60
          Other mMRSA           1    3    3   11    5    9
          unclassified MRSA     0    2    0    0    1    1
Hospital                      163  163  156  164  149  165
          AUS-2/3-like         31   33   27   31   29   28
          EMRSA-15-like         3    8    5    9    4    3
          nmMRSA …
Run Code Online (Sandbox Code Playgroud)

r margins

27
推荐指数
1
解决办法
2万
查看次数

更改Jupyter QtConsole设置

可以对Windows 7上的默认设置的设置进行持久更改吗?我想改变字体大小和外壳尺寸.

python jupyter

27
推荐指数
2
解决办法
2万
查看次数

将月mmm转换为数字

我已经给了一个csv,其中一个名为month的列作为char变量,带有该月的前三个字母.例如:

"Jan", "Feb","Mar",..."Dec"
Run Code Online (Sandbox Code Playgroud)

有没有办法将其转换为月份的数字表示形式,1到12,甚至是日期格式的类型?

datetime r

21
推荐指数
3
解决办法
3万
查看次数