小编NuV*_*lue的帖子

Windows 上的 RStudio 代理配置

这个问题已在：Configure proxy on Rstudio中提出。然而，这个问题始终没有得到解决。

RStudio 0.99.486我是版本和版本的用户R 3.2.2。在阅读了一些建议后，我尝试了两种在办公室配置代理设置的方法，但没有成功：

第一次尝试：在第一行输入 Rstudio：Sys.setenv(http_proxy="http://user_name:password@proxy.company_domain.es:8080/")

转到：-Tools、-Global Options、-Packages，然后取消标记选项：

“使用 Internet 库/HTTP 代理”

我还取消标记了选项：“使用 HTTP 的安全下载方法”。

另外，我右键R x64 3.2.2桌面图标，在“目标”阵营的1个空格后添加：

http_proxy=http://user_name:password@proxy.company_domain.es:8080/

当我收到消息时它不起作用：

install.packages 中的警告：无法打开：HTTP 状态为“407 需要代理身份验证”

第二次尝试：创建一个记事本文件，名称为：

.Renviron

保存在："C:\Users\username\Documents".

该文件包含以下两行：

http_proxy=http://proxy.company_domain.es/
http_proxy_user=user_name:password

Run Code Online (Sandbox Code Playgroud)

当我尝试安装软件包时，我收到：

“install.packages 中的警告：无法连接到端口 80 上的‘cran.rstudio.com’。无法访问存储库http://cran.rstudio.com/src/contrib的索引”

运行代码行后：R.home()我的 R_HOME 路线是：

“C:/Program Files/R/R-32~1.2”

我预先感谢您的建议和帮助。

settings proxy r rstudio

NuV*_*lue

2017 05-23

6
推荐指数

1
解决办法

2万
查看次数

在Windows 7上找不到对象pdflatex

我使用RStudio(版本3.1.2).当我尝试在我的R Markdown脚本中编织PDF时,我收到以下输出:

eval(expr,envir,enclos)出错:找不到对象'pdflatex'

我已经安装了MikTex basic,并在网上搜索过解决方案.在Mac用户的stackoverflow中有一个,我使用Windows 7.似乎问题是没有Tex安装的路径.我找到了这个在Windows上解决它的简要指南:在这里输入链接描述

所以,我做了它所说的:Sys.which("pdflatex")收到了:

pdflatex

""

Run Code Online (Sandbox Code Playgroud)

十我输入:Sys.getenv("PATH"),获得:

1 "C:\ Program Files\R\R-3.1.2\bin\x64; C:\ WINDOWS\system32; C:\ WINDOWS; C:\ WINDOWS\System32\Wbem; C:\ WINDOWS\System32\WindowsPowerShell\v1.0 \; C:\ Program Files(x86)\ Intel\OpenCL SDK\2.0\bin\x86; C:\ Program Files(x86)\ Intel\OpenCL SDK\2.0\bin\x64; C:\ Program Files\WIDCOMM\Bluetooth Software \; C:\ Program Files\WIDCOMM\Bluetooth Software\syswow64;:/ usr/texbin:/ usr/texbin"

最后,我输入:Sys.setenv(PATH=paste(Sys.getenv("PATH"),"/usr/texbin",sep=":")),但是当我再次尝试编织PDF时,它会向我显示相同的错误消息.感谢您的所有时间,我将不胜感激任何帮助.

latex r miktex rstudio r-markdown

NuV*_*lue

2014 11-19

4
推荐指数

1
解决办法

1万
查看次数

将值分配给PySpark dataFrame中的特定单元格

我想在我的特定细胞更改值Spark DataFrame使用PySpark。

琐碎的例子-我创建一个模拟Spark DataFrame：

df = spark.createDataFrame(
    [
     (1, 1.87, 'new_york'), 
     (4, 2.76, 'la'), 
     (6, 3.3, 'boston'), 
     (8, 4.1, 'detroit'), 
     (2, 5.70, 'miami'), 
     (3, 6.320, 'atlanta'), 
     (1, 6.1, 'houston')
    ],
    ('variable_1', "variable_2", "variable_3")
)

Run Code Online (Sandbox Code Playgroud)

运行display(df)我得到此表：

variable_1   variable_2   variable_3
    1           1.87    new_york
    4           2.76    la
    6           3.3     boston
    8           4.1     detroit
    2           5.7     miami
    3           6.32    atlanta
    1           6.1     houston

Run Code Online (Sandbox Code Playgroud)

Let's说，例如，我想分配为第4行和第3列的单元格的新值，即改变detroit了new_orleans。我知道作业在中有效df.iloc[4, 3] = 'new_orleans'或df.loc[4, 'detroit'] = …

python dataframe apache-spark pyspark

NuV*_*lue

2018 05-17

1
推荐指数

2
解决办法

2696
查看次数

按字母顺序对 dtype 进行排序

想象一下我们有一个pandas像这样的模拟数据框：

x = [1, 1000, 1001]
y = [200, 300, 400]
cat = ['first', 'second', 'third']
df = pd.DataFrame(dict(speed = x, price = y, award = cat))

Run Code Online (Sandbox Code Playgroud)

数据框df看起来像这样：

    speed   price   award
0   1       200     first
1   1000    300     second
2   1001    400     third

Run Code Online (Sandbox Code Playgroud)

如果我们想查看我们执行的列类型df.dtypes，则会给出以下输出：

speed     int64
price     int64
award    object
dtype: object

Run Code Online (Sandbox Code Playgroud)

我的问题是：是否有办法获得此输出，但按列名称的字母顺序排列？所需的输出将是这样的：

award    object
price     int64
speed     int64
dtype: object

Run Code Online (Sandbox Code Playgroud)

PD 我知道如何首先对进行排序，df以便列按字母顺序显示 ( df.sort_index(axis=1, inplace=True))，然后执行dtypes. 但更愿意以更有效的方式做同样的事情。

python list dataframe pandas

NuV*_*lue

lucky-day

1
推荐指数

1
解决办法

1934
查看次数

R中的CSV文件导入

我正在尝试将CSV文件导入到R中,以使用线性/逻辑回归进行欺诈分析.应该很简单的是变得复杂......这个数据集包含26个变量和超过200万行.我使用此命令行导入CSV文件:

data <- read.csv('C:/Users/amartinezsistac/OneDrive/PROYECTO/decla_cata_filtrados.csv',header=TRUE,sep=";")

Run Code Online (Sandbox Code Playgroud)

尽管如此,R仅在1个变量中导入了230万行.我附上一个的View(data)这一步骤的详细信息后得到的.我试过从sep =";"切换 to sep =","使用:

datos <- read.csv('C:/Users/amartinezsistac/OneDrive/PROYECTO/decla_cata_filtrados.csv',header=TRUE,sep=",")

Run Code Online (Sandbox Code Playgroud)

但得到此错误消息:

Error in read.table(file = file, header = header, sep = sep, quote = quote,  : 
  more columns than column names

Run Code Online (Sandbox Code Playgroud)

我尝试将read.csv更改为read.csv2(结果为230万行和1个变量); 或使用fill = TRUE选项(相同的结果),但导入不正确.我附上在Excel中打开的原始CSV外观的另一张图像. Excel中的原始CSV

我提前感谢任何建议或帮助解决它.

csv import r read.csv

NuV*_*lue

lucky-day

-2
推荐指数

1
解决办法

3224
查看次数

标签统计

r ×3

dataframe ×2

python ×2

rstudio ×2

apache-spark ×1

csv ×1

import ×1

latex ×1

list ×1

miktex ×1

pandas ×1

proxy ×1

pyspark ×1

r-markdown ×1

read.csv ×1

settings ×1

Windows 上的 RStudio 代理配置

在Windows 7上找不到对象pdflatex

将值分配给PySpark dataFrame中的特定单元格

按字母顺序对 dtype 进行排序

R中的CSV文件导入

标签 统计

小编NuV_lue的帖子

标签统计