这个问题已在:Configure proxy on Rstudio中提出。然而,这个问题始终没有得到解决。
RStudio 0.99.486我是版本和版本的用户R 3.2.2。在阅读了一些建议后,我尝试了两种在办公室配置代理设置的方法,但没有成功:
第一次尝试:在第一行输入 Rstudio:Sys.setenv(http_proxy="http://user_name:password@proxy.company_domain.es:8080/")
转到:-Tools、-Global Options、-Packages,然后取消标记选项:
“使用 Internet 库/HTTP 代理”
我还取消标记了选项:“使用 HTTP 的安全下载方法”。
另外,我右键R x64 3.2.2桌面图标,在“目标”阵营的1个空格后添加:
http_proxy=http://user_name:password@proxy.company_domain.es:8080/
当我收到消息时它不起作用:
install.packages 中的警告:无法打开:HTTP 状态为“407 需要代理身份验证”
第二次尝试:创建一个记事本文件,名称为:
.Renviron
保存在:"C:\Users\username\Documents".
该文件包含以下两行:
http_proxy=http://proxy.company_domain.es/
http_proxy_user=user_name:password
Run Code Online (Sandbox Code Playgroud)
当我尝试安装软件包时,我收到:
“install.packages 中的警告:无法连接到端口 80 上的‘cran.rstudio.com’。无法访问存储库http://cran.rstudio.com/src/contrib的索引”
运行代码行后:R.home()我的 R_HOME 路线是:
“C:/Program Files/R/R-32~1.2”
我预先感谢您的建议和帮助。
我使用RStudio(版本3.1.2).当我尝试在我的R Markdown脚本中编织PDF时,我收到以下输出:
eval(expr,envir,enclos)出错:找不到对象'pdflatex'
我已经安装了MikTex basic,并在网上搜索过解决方案.在Mac用户的stackoverflow中有一个,我使用Windows 7.似乎问题是没有Tex安装的路径.我找到了这个在Windows上解决它的简要指南:在这里输入链接描述
所以,我做了它所说的:Sys.which("pdflatex")收到了:
pdflatex
""
Run Code Online (Sandbox Code Playgroud)
十我输入:Sys.getenv("PATH"),获得:
1 "C:\ Program Files\R\R-3.1.2\bin\x64; C:\ WINDOWS\system32; C:\ WINDOWS; C:\ WINDOWS\System32\Wbem; C:\ WINDOWS\System32\WindowsPowerShell\v1.0 \; C:\ Program Files(x86)\ Intel\OpenCL SDK\2.0\bin\x86; C:\ Program Files(x86)\ Intel\OpenCL SDK\2.0\bin\x64; C:\ Program Files\WIDCOMM\Bluetooth Software \; C:\ Program Files\WIDCOMM\Bluetooth Software\syswow64;:/ usr/texbin:/ usr/texbin"
最后,我输入:Sys.setenv(PATH=paste(Sys.getenv("PATH"),"/usr/texbin",sep=":")),但是当我再次尝试编织PDF时,它会向我显示相同的错误消息.感谢您的所有时间,我将不胜感激任何帮助.
我想在我的特定细胞更改值Spark DataFrame使用PySpark。
琐碎的例子-我创建一个模拟Spark DataFrame:
df = spark.createDataFrame(
[
(1, 1.87, 'new_york'),
(4, 2.76, 'la'),
(6, 3.3, 'boston'),
(8, 4.1, 'detroit'),
(2, 5.70, 'miami'),
(3, 6.320, 'atlanta'),
(1, 6.1, 'houston')
],
('variable_1', "variable_2", "variable_3")
)
Run Code Online (Sandbox Code Playgroud)
运行display(df)我得到此表:
variable_1 variable_2 variable_3
1 1.87 new_york
4 2.76 la
6 3.3 boston
8 4.1 detroit
2 5.7 miami
3 6.32 atlanta
1 6.1 houston
Run Code Online (Sandbox Code Playgroud)
Let's说,例如,我想分配为第4行和第3列的单元格的新值,即改变detroit了new_orleans。我知道作业在中有效df.iloc[4, 3] = 'new_orleans'或df.loc[4, 'detroit'] = …
想象一下我们有一个pandas像这样的模拟数据框:
x = [1, 1000, 1001]
y = [200, 300, 400]
cat = ['first', 'second', 'third']
df = pd.DataFrame(dict(speed = x, price = y, award = cat))
Run Code Online (Sandbox Code Playgroud)
数据框df看起来像这样:
speed price award
0 1 200 first
1 1000 300 second
2 1001 400 third
Run Code Online (Sandbox Code Playgroud)
如果我们想查看我们执行的列类型df.dtypes,则会给出以下输出:
speed int64
price int64
award object
dtype: object
Run Code Online (Sandbox Code Playgroud)
我的问题是:是否有办法获得此输出,但按列名称的字母顺序排列?所需的输出将是这样的:
award object
price int64
speed int64
dtype: object
Run Code Online (Sandbox Code Playgroud)
PD 我知道如何首先对 进行排序,df以便列按字母顺序显示 ( df.sort_index(axis=1, inplace=True)),然后执行dtypes. 但更愿意以更有效的方式做同样的事情。
我正在尝试将CSV文件导入到R中,以使用线性/逻辑回归进行欺诈分析.应该很简单的是变得复杂......这个数据集包含26个变量和超过200万行.我使用此命令行导入CSV文件:
data <- read.csv('C:/Users/amartinezsistac/OneDrive/PROYECTO/decla_cata_filtrados.csv',header=TRUE,sep=";")
Run Code Online (Sandbox Code Playgroud)
尽管如此,R仅在1个变量中导入了230万行.我附上一个
的View(data)这一步骤的详细信息后得到的.我试过从sep =";"切换 to sep =","使用:
datos <- read.csv('C:/Users/amartinezsistac/OneDrive/PROYECTO/decla_cata_filtrados.csv',header=TRUE,sep=",")
Run Code Online (Sandbox Code Playgroud)
但得到此错误消息:
Error in read.table(file = file, header = header, sep = sep, quote = quote, :
more columns than column names
Run Code Online (Sandbox Code Playgroud)
我尝试将read.csv更改为read.csv2(结果为230万行和1个变量); 或使用fill = TRUE选项(相同的结果),但导入不正确.我附上在Excel中打开的原始CSV外观的另一张图像.
我提前感谢任何建议或帮助解决它.