我想将当前文件位置作为工作目录.
使用Rstudio(Works!):
# Author : Bhishan Poudel
# Program : writehere.r
# Source : Rscript writehere.r
# set working directory here
this.dir <- dirname(parent.frame(2)$ofile) # frame(3) also works.
setwd(this.dir)
# Sample data to test this code
mydata <- seq(1:10)
write.csv(mydata,"writehere.dat")
#This works flawlessly in MacOS 10.9 and Ubuntu 15.1.
Run Code Online (Sandbox Code Playgroud)
使用来自终端的命令:Rscript writehere.r(不起作用!)
Error in dirname(parent.frame(2)$ofile) :
a character vector argument expected
Execution halted
------------------
(program exited with code: 1)
Run Code Online (Sandbox Code Playgroud)
使用终端命令:Rscript writehere.r(立即工作!)
# Author : Bhishan Poudel
# Program : writehere.r
# …Run Code Online (Sandbox Code Playgroud) 在发布此问题之前,我检查了所有可能的重复问题,并尝试了所有方法,仍然无法解决问题.
我在matplotlib中有一个简单的情节.当我注释掉调用plt.fill_between()代码的行完美时,但是当我取消注释它会抛出溢出错误.
注意:我的笔记本电脑与Ubuntu 15.10发生此错误
但是在MacOS中我尝试了相同的代码,它没有显示任何错误(令人惊讶!)
更新: 我使用后端作为TkAgg.
print(mpl.rcParamsDefault)
# Answer is agg.
Run Code Online (Sandbox Code Playgroud)
我的代码如下所示:
#!/usr/bin/env python
# -*- coding: utf-8 -*-
# Author : Bhishan Poudel
# Date : Mar 28, 2016
# Topic : OverflowError: Allocated too many blocks
# Note : python --version ==> Python 2.7.10
# Note : lsb_release -a ==> ubuntu 15.10
# Imports
import numpy as np
import matplotlib as mpl
import matplotlib.pyplot as plt
# plot values
x = np.arange(0.001, 25.0, 0.01)
A …Run Code Online (Sandbox Code Playgroud) 我在路径/ home/bhishan/Copy/try中创建了一个名为"try"的文件夹,然后在该文件夹中我给出了一些命令:
我的命令如下:
curl -s -O \
http://github-media-downloads.s3.amazonaws.com/osx/git-credential-osxkeychain
chmod u+x git-credential-osxkeychain
sudo mv git-credential-osxkeychain `dirname \`which git\``
git config --global credential.helper osxkeychain
git init
git remote add origin https:
git remote add origin https:
git push origin master
Run Code Online (Sandbox Code Playgroud)
==============================
它工作正常但是,当我尝试删除尝试文件夹时,我无法删除该文件夹.我也不能给命令:
git init
Run Code Online (Sandbox Code Playgroud)
在try文件夹中(我有一个.git文件夹)
================================================== ===
我的命令行和错误报告是这样的:
bhishan@bhishan-HP-Pavilion-dv6-Notebook-PC:~/Copy/try$ git init
error: could not lock config file /home/bhishan/Copy/try/.git/config: Permission denied
Run Code Online (Sandbox Code Playgroud)
现在,我的问题是如何删除名为"try"的文件夹?
我已经看到很多情况下缺失值要么由均值或中位数填充。我想知道我们如何用频率填充缺失值。
这是我的设置:
import numpy as np
import pandas as pd
df = pd.DataFrame({'sex': [1,1,1,1,0,0,np.nan,np.nan,np.nan]})
df['sex_fillna'] = df['sex'].fillna(df.sex.mode()[0])
print(df)
sex sex_fillna
0 1.0 1.0 We have 4 males
1 1.0 1.0
2 1.0 1.0
3 1.0 1.0
4 0.0 0.0 we have 2 females, so ratio is 2
5 0.0 0.0
6 NaN 1.0 Here, I want random choice of [1,1,0]
7 NaN 1.0 eg. 1,1,0 or 1,0,1 or 0,1,1 randomly
8 NaN 1.0
Run Code Online (Sandbox Code Playgroud)
有没有通用的方法可以做到这一点?
我的尝试
df['sex_fillan2'] = df['sex'].fillna(np.random.randint(0,2)) # here …Run Code Online (Sandbox Code Playgroud) 如何过滤python中特定模块的特定警告?
ERROR:
cross_val_score(model, df_Xtrain,ytrain,cv=2,scoring='r2')
/usr/local/lib/python3.6/dist-packages/sklearn/linear_model/_ridge.py:148: LinAlgWarning: Ill-conditioned matrix (rcond=3.275e-20): result may not be accurate.
overwrite_a=True).T
Run Code Online (Sandbox Code Playgroud)
import warnings
warnings.filterwarnings(action='ignore',module='sklearn')
cross_val_score(model, df_Xtrain,ytrain,cv=2,scoring='r2')
This works but I assume it ignores all the warnings such as deprecation warnings. I would like to exclude only LinAlgWarning
Run Code Online (Sandbox Code Playgroud)
import warnings
warnings.filterwarnings(action='ignore', category='LinAlgWarning', module='sklearn')
Run Code Online (Sandbox Code Playgroud)
有没有像这样过滤特定警告的方法?
我搜索了有关从 URL 读取 csv 的类似问题,但找不到从 google drive csv 文件读取 csv 文件的方法。
我的尝试:
import pandas as pd
url = 'https://drive.google.com/file/d/0B6GhBwm5vaB2ekdlZW5WZnppb28/view?usp=sharing'
dfs = pd.read_html(url)
Run Code Online (Sandbox Code Playgroud)
我们如何在 Pandas 中读取这个文件?
相关链接:
这一定是一个简单的问题,但是,它一直困扰着我一段时间。
对于下面的数据框:
df = pd.DataFrame({'c0': ['a','b','a'],'c1': ['a','bb','a'],'c2':[10,20,30]})
c0 c1 c2
0 a a 10
1 b bb 20
2 a a 30
Run Code Online (Sandbox Code Playgroud)
如何获得计数> 1的输出?
我试过了:
df.groupby(['c0','c1'])['c2'].count()
c0 c1
a a 2
b bb 1
Run Code Online (Sandbox Code Playgroud)
需要的是:
c0 c1
a a 2
Run Code Online (Sandbox Code Playgroud)
我正在寻找其他
x = df.groupby(['c0','c1'])['c2'].count()
x[x>1]
Run Code Online (Sandbox Code Playgroud)
即单行答案。
我试图在 plotly 的同一个图中绘制条形图和散点图,但它只显示散点图。
如何显示两个图?
import numpy as np
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
from matplotlib.ticker import PercentFormatter
import plotly
import plotly.offline as py
import plotly.graph_objs as go
import plotly.figure_factory as ff
import plotly.tools as tls
from plotly.subplots import make_subplots
from plotly.offline import plot, iplot, init_notebook_mode
init_notebook_mode(connected=False)
df = pd.DataFrame({
'price': [ 4.0, 17.0, 7.0, 7.0, 2.0, 1.0, 1.0],
'item': ['apple', 'banana', 'carrot', 'plum',
'orange', 'date', 'cherry']})
df = df.sort_values(num,ascending=False)
df['cumulative_sum'] = df[num].cumsum() …Run Code Online (Sandbox Code Playgroud) 我和jupyter-notebook有一个奇怪的问题.
我正在练习笔记本,它有降价和代码单元格.
当我保存并重新打开笔记本时,我可以编辑代码单元格,但不能编辑降价单元格.
尝试:
1.重新加载页面.
2.让笔记本电脑值得信赖.
3.尝试将单元格类型从markdown更改为code或raw但仍无法编辑.
注意:我可以删除markdown上的一些字母,但我不能添加任何字母.此外,如果我按Enter键将创建新行,但我不能在那里写任何东西.
问题 我们如何编辑jupyter-notebook的降价单元格?
代码如下:
https://github.com/bhishanpdl/Shared_to_public/blob/master/notebook_problem/example.ipynb
在 XGBOOST 特征重要性中使用两种不同的方法,给了我两个不同的最重要的特征,应该相信哪一个?
什么时候应该使用哪种方法?我很困惑。
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
%matplotlib inline
import seaborn as sns
import xgboost as xgb
df = sns.load_dataset('mpg')
df = df.drop(['name','origin'],axis=1)
X = df.iloc[:,1:]
y = df.iloc[:,0]
Run Code Online (Sandbox Code Playgroud)
# fit the model
model_xgb_numpy = xgb.XGBRegressor(n_jobs=-1,objective='reg:squarederror')
model_xgb_numpy.fit(X.to_numpy(), y.to_numpy())
plt.bar(range(len(model_xgb_numpy.feature_importances_)), model_xgb_numpy.feature_importances_)
Run Code Online (Sandbox Code Playgroud)
# fit the model
model_xgb_pandas = xgb.XGBRegressor(n_jobs=-1,objective='reg:squarederror')
model_xgb_pandas.fit(X, y)
axsub = xgb.plot_importance(model_xgb_pandas)
Run Code Online (Sandbox Code Playgroud)
Numpy 方法显示第 0 个特征柱面是最重要的。Pandas 方法显示型号年份最重要。哪一项是正确的最重要的特征?