小编Lov*_*eow的帖子

按R中的因子着色图

我正在制作两个变量的散点图,并希望通过因子变量对点进行着色.这是一些可重现的代码:

data <- iris
plot(data$Sepal.Length, data$Sepal.Width, col=data$Species)
Run Code Online (Sandbox Code Playgroud)

这一切都很好,但我怎么知道什么因素被涂上了什么颜色?

plot r colors r-factor

27
推荐指数
6
解决办法
21万
查看次数

读取具有不同行数的多个CSV以在文件开头跳过

我必须阅读大约300个单独的CSV.我已设法使用循环和结构化CSV名称自动化该过程.但是,每个CSV在开始时都有14-17行垃圾,并且随机变化,因此在read.table命令中编写'skip'参数的硬编码将不起作用.每个CSV的列名和列数相同.

这是我反对的一个例子:

QUICK STATISTICS:

      Directory: Data,,,,
           File: Final_Comp_Zn_1
      Selection: SEL{Ox*1000+Doma=1201}
         Weight: None,,,
     ,,Variable: AG,,,

Total Number of Samples: 450212  Number of Selected Samples: 277


Statistics

VARIABLE,Min slice Y(m),Max slice Y(m),Count,Minimum,Maximum,Mean,Std.Dev.,Variance,Total Samples in Domain,Active Samples in Domain AG,  
6780.00,   6840.00,         7,    3.0000,   52.5000,   23.4143,   16.8507,  283.9469,        10,        10 AG,   
6840.00,   6900.00,         4,    4.0000,    5.5000,    4.9500,    0.5766,    0.3325,        13,        13 AG,   
6900.00,   6960.00,        16,    1.0000,   37.0000,    8.7625,    9.0047,   81.0848,        29,        29 AG,   
6960.00,   7020.00,        58,    3.0000,   73.5000,   10.6931,   11.9087,  141.8172,       132,       132 …
Run Code Online (Sandbox Code Playgroud)

csv r read.table

11
推荐指数
2
解决办法
1478
查看次数

R函数which.max与tapply

我试图通过一个因子创建一个具有最大记录数据的数据框.我想要一个4行数据帧(每个G一个),该组中X的最大值和相应的Y值.我知道我可以写一个循环但不愿意.

Data<-data.frame(X=rnorm(200), Y=rnorm(200), G=rep(c(1,2,3,4), each=50))
XMax<-tapply(Data$X, Data$G, function(x){max(x, na.rm=T)})
WhichXMax<-tapply(Data$X, Data$G, function(x){which.max(x)})
Run Code Online (Sandbox Code Playgroud)

which.max函数在数据被tapply因子子集化后返回行号,我真的希望行号引用数据行.所以我可以这样做;

YMax<-Data$Y[Which]
MaxData<-data.frame(XMax=XMax, YMax=YMax, G=levels(Data$G))
Run Code Online (Sandbox Code Playgroud)

r which tapply

4
推荐指数
3
解决办法
1402
查看次数

熊猫报告系列是小数时的对象

我需要一种自动可靠的方法来查找 Pandas 数据框中每一列的数据类型。我一直在使用 .dtype() 但注意到它有一些意想不到的东西。

考虑这个 10 行数据框:

df['a']
Out[6]: 
0    250.00
1    750.00
2      0.00
3      0.00
4      0.00
5      0.00
6      0.00
7      0.00
8      0.00
9      0.00
Name: a, dtype: object

type(df['a'][0])
Out[9]: decimal.Decimal
Run Code Online (Sandbox Code Playgroud)

当每个条目都是小数时,为什么整个列的 dtype 都是“对象”?我真的需要它来表示十进制或浮点数或数字。任何帮助,将不胜感激!

python types pandas

3
推荐指数
1
解决办法
831
查看次数

Python字典未在循环中按预期更新

我正在尝试创建一个总结另一个的字典.我希望仅当密钥与details_dict中的"parent"值匹配时才会更新summary_dict.我所写的内容似乎并没有像我期望的那样访问summary_dict.print语句显示它继续追加循环中的第一个iterable,而不是从summary_dict中获取正确的值.

detail_dict = {'a123': {"data": [1, 2, 3, 4], "parent": "a"},
               'a124': {"data": [1, 2, 3, 4, 5], "parent": "a"},
               'b123': {"data": [1, 2, 3], "parent": "b"},
               'b124': {"data": [1], "parent": "b"}}

summary_dict = dict.fromkeys(["a", "b"], {"data": [],
                                          "data_len": []})

for k, v in detail_dict.iteritems():
    summary_dict[v['parent']]["data"].append(v["data"])
    summary_dict[v['parent']]["data_len"].append(len(v["data"]))
    print "\nMy value is "
    print v
    print "\nMy summary dictionary now looks like:"
    print summary_dict[v['parent']]
Run Code Online (Sandbox Code Playgroud)

我想要的结果字典是:

{"a": {"data": [[1, 2, 3, 4], [1, 2, 3, 4, 5]],
       "data_len": [4, 5]},
 "b": {"data": …
Run Code Online (Sandbox Code Playgroud)

python dictionary loops iteritems

3
推荐指数
2
解决办法
698
查看次数

R中的'jpeg'功能不保存当前设备

我试图在R中使用jpeg函数自动保存图形.如果我只使用默认的图形设备而不尝试改变它,该功能可以正常工作.但是当我尝试通过'X11'功能改变设备时它不起作用(我认为它记录了空设备而不是X11设备).Below是一些代码,你可以自己运行.任何帮助将不胜感激!

    x<-rnorm(10, 3, 4)

    y<-rnorm(10, 68, 2)

    jpeg(file="YOUR FILE PATH", quality=100)

     X11(width=20, height=15)

     par(mfrow=c(2,2))

     plot(x,y, main="1")
     plot(x,y,main="2")
     plot(x,y, main="3")
     plot(x,y,main="4")

     dev.off() 
Run Code Online (Sandbox Code Playgroud)

plot jpeg r

2
推荐指数
1
解决办法
2361
查看次数

标签 统计

r ×4

plot ×2

python ×2

colors ×1

csv ×1

dictionary ×1

iteritems ×1

jpeg ×1

loops ×1

pandas ×1

r-factor ×1

read.table ×1

tapply ×1

types ×1

which ×1