小编Pou*_*del的帖子

如何在R编程中将当前文件位置设置为默认工作目录?

我想将当前文件位置作为工作目录.

使用Rstudio(Works!):

# Author  : Bhishan Poudel
# Program : writehere.r
# Source  : Rscript writehere.r

# set working directory here
this.dir <- dirname(parent.frame(2)$ofile) # frame(3) also works.
setwd(this.dir)

# Sample data to test this code
mydata <- seq(1:10)
write.csv(mydata,"writehere.dat")
#This works flawlessly in  MacOS 10.9 and Ubuntu 15.1.
Run Code Online (Sandbox Code Playgroud)

使用来自终端的命令:Rscript writehere.r(不起作用!)

Error in dirname(parent.frame(2)$ofile) : 
  a character vector argument expected
Execution halted


------------------
(program exited with code: 1)
Run Code Online (Sandbox Code Playgroud)

使用终端命令:Rscript writehere.r(立即工作!)

# Author  : Bhishan Poudel
# Program : writehere.r
# …
Run Code Online (Sandbox Code Playgroud)

r setwd

21
推荐指数
2
解决办法
9897
查看次数

"OverflowError:分配了太多块":

在发布此问题之前,我检查了所有可能的重复问题,并尝试了所有方法,仍然无法解决问题.

我在matplotlib中有一个简单的情节.当我注释掉调用plt.fill_between()代码的行完美时,但是当我取消注释它会抛出溢出错误.

注意:我的笔记本电脑与Ubuntu 15.10发生此错误
但是在MacOS中我尝试了相同的代码,它没有显示任何错误(令人惊讶!)

更新: 我使用后端作为TkAgg.

print(mpl.rcParamsDefault)
# Answer is agg.
Run Code Online (Sandbox Code Playgroud)

我的代码如下所示:

#!/usr/bin/env python
# -*- coding: utf-8 -*-

# Author  : Bhishan Poudel
# Date    : Mar 28, 2016
# Topic   : OverflowError: Allocated too many blocks
# Note    : python --version ==> Python 2.7.10
# Note    : lsb_release -a   ==> ubuntu 15.10

# Imports
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt

# plot values
x = np.arange(0.001, 25.0, 0.01)
A …
Run Code Online (Sandbox Code Playgroud)

python error-handling plot matplotlib

14
推荐指数
1
解决办法
1873
查看次数

错误:无法锁定配置文件filepath /../.git/config:权限被拒绝

我在路径/ home/bhishan/Copy/try中创建了一个名为"try"的文件夹,然后在该文件夹中我给出了一些命令:

我的命令如下:

curl -s -O \
http://github-media-downloads.s3.amazonaws.com/osx/git-credential-osxkeychain

chmod u+x git-credential-osxkeychain

sudo mv git-credential-osxkeychain `dirname \`which git\``

git config --global credential.helper osxkeychain

git init

git remote add origin https:

git remote add origin https:

git push origin master
Run Code Online (Sandbox Code Playgroud)

==============================

它工作正常但是,当我尝试删除尝试文件夹时,我无法删除该文件夹.我也不能给命令:

git init
Run Code Online (Sandbox Code Playgroud)

在try文件夹中(我有一个.git文件夹)

================================================== ===

我的命令行和错误报告是这样的:

bhishan@bhishan-HP-Pavilion-dv6-Notebook-PC:~/Copy/try$ git init
error: could not lock config file /home/bhishan/Copy/try/.git/config: Permission denied
Run Code Online (Sandbox Code Playgroud)

现在,我的问题是如何删除名为"try"的文件夹?

ubuntu github delete-file

12
推荐指数
1
解决办法
5万
查看次数

Python根据频率填充缺失值

我已经看到很多情况下缺失值要么由均值或中位数填充。我想知道我们如何用频率填充缺失值。

这是我的设置:

import numpy as np
import pandas as pd


df = pd.DataFrame({'sex': [1,1,1,1,0,0,np.nan,np.nan,np.nan]})
df['sex_fillna'] = df['sex'].fillna(df.sex.mode()[0])
print(df)
   sex  sex_fillna
0  1.0         1.0  We have 4 males
1  1.0         1.0
2  1.0         1.0
3  1.0         1.0
4  0.0         0.0  we have 2 females, so ratio is 2
5  0.0         0.0
6  NaN         1.0  Here, I want random choice of [1,1,0]  
7  NaN         1.0  eg. 1,1,0 or 1,0,1 or 0,1,1 randomly
8  NaN         1.0

Run Code Online (Sandbox Code Playgroud)

有没有通用的方法可以做到这一点?

我的尝试

df['sex_fillan2'] = df['sex'].fillna(np.random.randint(0,2)) # here …
Run Code Online (Sandbox Code Playgroud)

python numpy pandas

11
推荐指数
1
解决办法
1197
查看次数

Python如何过滤特定警告?

如何过滤python中特定模块的特定警告?

微量元素

ERROR:

cross_val_score(model, df_Xtrain,ytrain,cv=2,scoring='r2')

/usr/local/lib/python3.6/dist-packages/sklearn/linear_model/_ridge.py:148: LinAlgWarning: Ill-conditioned matrix (rcond=3.275e-20): result may not be accurate.
  overwrite_a=True).T

Run Code Online (Sandbox Code Playgroud)

我的尝试

import warnings
warnings.filterwarnings(action='ignore',module='sklearn')

cross_val_score(model, df_Xtrain,ytrain,cv=2,scoring='r2')

This works but I assume it ignores all the warnings such as deprecation warnings. I would like to exclude only LinAlgWarning
Run Code Online (Sandbox Code Playgroud)

必填 喜欢

import warnings
warnings.filterwarnings(action='ignore', category='LinAlgWarning', module='sklearn')
Run Code Online (Sandbox Code Playgroud)

有没有像这样过滤特定警告的方法?

python warnings suppress-warnings

11
推荐指数
1
解决办法
5553
查看次数

Pandas:如何从 Google Drive public 读取 CSV 文件?

我搜索了有关从 URL 读取 csv 的类似问题,但找不到从 google drive csv 文件读取 csv 文件的方法。

我的尝试:

import pandas as pd

url = 'https://drive.google.com/file/d/0B6GhBwm5vaB2ekdlZW5WZnppb28/view?usp=sharing'
dfs = pd.read_html(url)
Run Code Online (Sandbox Code Playgroud)

我们如何在 Pandas 中读取这个文件?

相关链接:

python pandas

10
推荐指数
4
解决办法
2万
查看次数

Pandas groupby 计数大于 1

这一定是一个简单的问题,但是,它一直困扰着我一段时间。

对于下面的数据框:

df = pd.DataFrame({'c0': ['a','b','a'],'c1': ['a','bb','a'],'c2':[10,20,30]})
  c0  c1  c2
0  a   a  10
1  b  bb  20
2  a   a  30
Run Code Online (Sandbox Code Playgroud)

如何获得计数> 1的输出?

我试过了:

df.groupby(['c0','c1'])['c2'].count()
c0  c1
a   a     2
b   bb    1
Run Code Online (Sandbox Code Playgroud)

需要的是:

c0  c1
a   a     2
Run Code Online (Sandbox Code Playgroud)

我正在寻找其他

x = df.groupby(['c0','c1'])['c2'].count()
x[x>1]
Run Code Online (Sandbox Code Playgroud)

即单行答案。

python pandas

9
推荐指数
1
解决办法
1万
查看次数

如何在 plotly 中叠加同一图中的两个图(在 plotly 中创建帕累托图)?

我试图在 plotly 的同一个图中绘制条形图和散点图,但它只显示散点图。

如何显示两个图?

数据

import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib.ticker import PercentFormatter

import plotly
import plotly.offline as py
import plotly.graph_objs as go
import plotly.figure_factory as ff
import plotly.tools as tls
from plotly.subplots import make_subplots
from plotly.offline import plot, iplot, init_notebook_mode
init_notebook_mode(connected=False)

df = pd.DataFrame({
            'price': [ 4.0, 17.0, 7.0, 7.0, 2.0, 1.0, 1.0],
            'item': ['apple', 'banana', 'carrot', 'plum',
                    'orange', 'date', 'cherry']})

df = df.sort_values(num,ascending=False)
df['cumulative_sum'] = df[num].cumsum() …
Run Code Online (Sandbox Code Playgroud)

python plotly

9
推荐指数
1
解决办法
1万
查看次数

如何在jupyter-notebook中编辑markdown单元格

我和jupyter-notebook有一个奇怪的问题.
我正在练习笔记本,它有降价和代码单元格.

当我保存并重新打开笔记本时,我可以编辑代码单元格,但不能编辑降价单元格.

尝试:
1.重新加载页面.
2.让笔记本电脑值得信赖.
3.尝试将单元格类型从markdown更改为code或raw但仍无法编辑.

注意:我可以删除markdown上的一些字母,但我不能添加任何字母.此外,如果我按Enter键将创建新行,但我不能在那里写任何东西.

问题 我们如何编辑jupyter-notebook的降价单元格?

代码如下:

https://github.com/bhishanpdl/Shared_to_public/blob/master/notebook_problem/example.ipynb

python markdown ipython-notebook jupyter-notebook

8
推荐指数
2
解决办法
1万
查看次数

如何在 XGBOOST 中获得正确的特征重要性图?

在 XGBOOST 特征重要性中使用两种不同的方法,给了我两个不同的最重要的特征,应该相信哪一个?

什么时候应该使用哪种方法?我很困惑。

设置

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt

%matplotlib inline

import seaborn as sns
import xgboost as xgb

df = sns.load_dataset('mpg')
df = df.drop(['name','origin'],axis=1)

X = df.iloc[:,1:]
y = df.iloc[:,0]
Run Code Online (Sandbox Code Playgroud)

Numpy 数组

# fit the model
model_xgb_numpy = xgb.XGBRegressor(n_jobs=-1,objective='reg:squarederror')
model_xgb_numpy.fit(X.to_numpy(), y.to_numpy())

plt.bar(range(len(model_xgb_numpy.feature_importances_)), model_xgb_numpy.feature_importances_)
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

熊猫数据框

# fit the model
model_xgb_pandas = xgb.XGBRegressor(n_jobs=-1,objective='reg:squarederror')
model_xgb_pandas.fit(X, y)
axsub = xgb.plot_importance(model_xgb_pandas)
Run Code Online (Sandbox Code Playgroud)

在此输入图像描述

问题

Numpy 方法显示第 0 个特征柱面是最重要的。Pandas 方法显示型号年份最重要。哪一项是正确的最重要的特征?

参考

python xgboost

8
推荐指数
2
解决办法
7228
查看次数