小编NuV*_*lue的帖子

Windows 上的 RStudio 代理配置

这个问题已在:Configure proxy on Rstudio中提出。然而,这个问题始终没有得到解决。

RStudio 0.99.486我是版本和版本的用户R 3.2.2。在阅读了一些建议后,我尝试了两种在办公室配置代理设置的方法,但没有成功:

第一次尝试:在第一行输入 Rstudio:Sys.setenv(http_proxy="http://user_name:password@proxy.company_domain.es:8080/")

转到:-Tools、-Global Options、-Packages,然后取消标记选项:

“使用 Internet 库/HTTP 代理”

我还取消标记了选项:“使用 HTTP 的安全下载方法”。

另外,我右键R x64 3.2.2桌面图标,在“目标”阵营的1个空格后添加:

http_proxy=http://user_name:password@proxy.company_domain.es:8080/

当我收到消息时它不起作用:

install.packages 中的警告:无法打开:HTTP 状态为“407 需要代理身份验证”

第二次尝试:创建一个记事本文件,名称为:

.Renviron

保存在:"C:\Users\username\Documents".

该文件包含以下两行:

http_proxy=http://proxy.company_domain.es/
http_proxy_user=user_name:password
Run Code Online (Sandbox Code Playgroud)

当我尝试安装软件包时,我收到:

“install.packages 中的警告:无法连接到端口 80 上的‘cran.rstudio.com’。无法访问存储库http://cran.rstudio.com/src/contrib的索引”

运行代码行后:R.home()我的 R_HOME 路线是:

“C:/Program Files/R/R-32~1.2”

我预先感谢您的建议和帮助。

settings proxy r rstudio

6
推荐指数
1
解决办法
2万
查看次数

在Windows 7上找不到对象pdflatex

我使用RStudio(版本3.1.2).当我尝试在我的R Markdown脚本中编织PDF时,我收到以下输出:

eval(expr,envir,enclos)出错:找不到对象'pdflatex'

我已经安装了MikTex basic,并在网上搜索过解决方案.在Mac用户的stackoverflow中有一个,我使用Windows 7.似乎问题是没有Tex安装的路径.我找到了这个在Windows上解决它的简要指南:在这里输入链接描述

所以,我做了它所说的:Sys.which("pdflatex")收到了:

pdflatex

  ""
Run Code Online (Sandbox Code Playgroud)

十我输入:Sys.getenv("PATH"),获得:

1 "C:\ Program Files\R\R-3.1.2\bin\x64; C:\ WINDOWS\system32; C:\ WINDOWS; C:\ WINDOWS\System32\Wbem; C:\ WINDOWS\System32\WindowsPowerShell\v1.0 \; C:\ Program Files(x86)\ Intel\OpenCL SDK\2.0\bin\x86; C:\ Program Files(x86)\ Intel\OpenCL SDK\2.0\bin\x64; C:\ Program Files\WIDCOMM\Bluetooth Software \; C:\ Program Files\WIDCOMM\Bluetooth Software\syswow64;:/ usr/texbin:/ usr/texbin"

最后,我输入:Sys.setenv(PATH=paste(Sys.getenv("PATH"),"/usr/texbin",sep=":")),但是当我再次尝试编织PDF时,它会向我显示相同的错误消息.感谢您的所有时间,我将不胜感激任何帮助.

latex r miktex rstudio r-markdown

4
推荐指数
1
解决办法
1万
查看次数

将值分配给PySpark dataFrame中的特定单元格

我想在我的特定细胞更改值Spark DataFrame使用PySpark

琐碎的例子-我创建一个模拟Spark DataFrame

df = spark.createDataFrame(
    [
     (1, 1.87, 'new_york'), 
     (4, 2.76, 'la'), 
     (6, 3.3, 'boston'), 
     (8, 4.1, 'detroit'), 
     (2, 5.70, 'miami'), 
     (3, 6.320, 'atlanta'), 
     (1, 6.1, 'houston')
    ],
    ('variable_1', "variable_2", "variable_3")
)
Run Code Online (Sandbox Code Playgroud)

运行display(df)我得到此表:

variable_1   variable_2   variable_3
    1           1.87    new_york
    4           2.76    la
    6           3.3     boston
    8           4.1     detroit
    2           5.7     miami
    3           6.32    atlanta
    1           6.1     houston
Run Code Online (Sandbox Code Playgroud)

Let's说,例如,我想分配为第4行和第3列的单元格的新值,即改变detroitnew_orleans。我知道作业在中有效df.iloc[4, 3] = 'new_orleans'df.loc[4, 'detroit'] = …

python dataframe apache-spark pyspark

1
推荐指数
2
解决办法
2696
查看次数

按字母顺序对 dtype 进行排序

想象一下我们有一个pandas像这样的模拟数据框:

x = [1, 1000, 1001]
y = [200, 300, 400]
cat = ['first', 'second', 'third']
df = pd.DataFrame(dict(speed = x, price = y, award = cat))
Run Code Online (Sandbox Code Playgroud)

数据框df看起来像这样:

    speed   price   award
0   1       200     first
1   1000    300     second
2   1001    400     third
Run Code Online (Sandbox Code Playgroud)

如果我们想查看我们执行的列类型df.dtypes,则会给出以下输出:

speed     int64
price     int64
award    object
dtype: object
Run Code Online (Sandbox Code Playgroud)

我的问题是:是否有办法获得此输出,但按列名称的字母顺序排列?所需的输出将是这样的:

award    object
price     int64
speed     int64
dtype: object
Run Code Online (Sandbox Code Playgroud)

PD 我知道如何首先对 进行排序,df以便列按字母顺序显示 ( df.sort_index(axis=1, inplace=True)),然后执行dtypes. 但更愿意以更有效的方式做同样的事情。

python list dataframe pandas

1
推荐指数
1
解决办法
1934
查看次数

R中的CSV文件导入

我正在尝试将CS​​V文件导入到R中,以使用线性/逻辑回归进行欺诈分析.应该很简单的是变得复杂......这个数据集包含26个变量和超过200万行.我使用此命令行导入CSV文件:

data <- read.csv('C:/Users/amartinezsistac/OneDrive/PROYECTO/decla_cata_filtrados.csv',header=TRUE,sep=";")
Run Code Online (Sandbox Code Playgroud)

尽管如此,R仅在1个变量中导入了230万行.我附上一个图片View(data)这一步骤的详细信息后得到的.我试过从sep =";"切换 to sep =","使用:

datos <- read.csv('C:/Users/amartinezsistac/OneDrive/PROYECTO/decla_cata_filtrados.csv',header=TRUE,sep=",")
Run Code Online (Sandbox Code Playgroud)

但得到此错误消息:

Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
  more columns than column names
Run Code Online (Sandbox Code Playgroud)

我尝试将read.csv更改为read.csv2(结果为230万行和1个变量); 或使用fill = TRUE选项(相同的结果),但导入不正确.我附上在Excel中打开的原始CSV外观的另一张图像.Excel中的原始CSV

我提前感谢任何建议或帮助解决它.

csv import r read.csv

-2
推荐指数
1
解决办法
3224
查看次数