小编use*_*008的帖子

在Python中安装scikit-learn的问题

我试图安装python包scikit-learn.我一直都错了.

我试过了

 pip install scikit­-learn
Run Code Online (Sandbox Code Playgroud)

该错误如下所示.我的安装有什么问题?

compile options: '-I/System/Library/Frameworks/Python.framework/Versions/2.7/Extras/lib/python/numpy/core/include -c'

c++: sklearn/svm/src/libsvm/libsvm_template.cpp

clang: error: unknown argument: '-mno-fused-madd' [-Wunused-command-line-argument-hard-error-in-future]

clang: note: this will be a hard error (cannot be downgraded to a warning) in the future

clang: error: unknown argument: '-mno-fused-madd' [-Wunused-command-line-argument-hard-error-in-future]

clang: note: this will be a hard error (cannot be downgraded to a warning) in the future

error: Command "c++ -fno-strict-aliasing -fno-common -dynamic -arch x86_64 -arch i386 -g -Os -pipe -fno-common -fno-strict-aliasing -fwrapv -mno-fused-madd -DENABLE_DTRACE -DMACOSX -DNDEBUG -Wall -Wshorten-64-to-32 …
Run Code Online (Sandbox Code Playgroud)

python pip scikit-learn

8
推荐指数
1
解决办法
3185
查看次数

使用data.table重新编码变量

我正在尝试使用data.table重新编码变量.我用谷歌搜索了近2个小时,但找不到答案.

假设我有一个data.table如下:

DT <- data.table(V1=c(0L,1L,2L),
                 V2=LETTERS[1:3],
                 V4=1:12)
Run Code Online (Sandbox Code Playgroud)

我想重新编码V1和V2.对于V1,我想将1s重新编码为0和2s为1.对于V2,我想重新编码A到T,B到K,C到D.

如果我使用dplyr,很简单.

library(dplyr)
DT %>% 
  mutate(V1 = recode(V1, `1` = 0L, `2` = 1L)) %>% 
  mutate(V2 = recode(V2, A = "T", B = "K", C = "D"))
Run Code Online (Sandbox Code Playgroud)

但我不知道如何在data.table中执行此操作

DT[V1==1, V1 := 0]
DT[V1==2, V1 := 1]
DT[V2=="A", V2 := "T"]
DT[V2=="B", V2 := "K"]
DT[V2=="C", V2 := "D"]
Run Code Online (Sandbox Code Playgroud)

以上是我认为最好的代码.但必须有一种更好,更有效的方法来做到这一点.


编辑

我改变了我想重新编码V2的方式,使我的例子更加通用.

r recode data.table

6
推荐指数
2
解决办法
2580
查看次数

在R中,如何计算不同变量给出的因子百分比?

我试图计算变量中因子的百分比,并希望使该百分比以其他变量为条件.

例如,我有这样的数据.

State Ideology
CO    Liberal
CO    Liberal
CO    Liberal
CO    Conservative
CO    Conservative
CO    Independent
DC    Independent
DC    Conservative
DC    Liberal
Run Code Online (Sandbox Code Playgroud)

我试图在每个州找到每个自由党,保守派和独立党的百分比.

我试着像ddply一样使用

liberal_per<-ddply(data,.(State), summarize,total=table(Ideology)[1]/sum(Ideology))
Run Code Online (Sandbox Code Playgroud)

但它不起作用.我应该如何找到国家给出的每个因素的百分比?

谢谢!

r percentage

4
推荐指数
1
解决办法
2万
查看次数

ggplot中有两行X轴标签

我想在ggplot中制作两行X轴标签.

在此输入图像描述

在这个图中,我想在每个指定年份下面再添加一行标签.就像是

1990 1995 2000 2005 2010 cold warm warm cold warm

这是我制作这个情节的代码

ggplot(subset(dat, countryid %in% c("1")),  aes(date, 
nonpartisan))+geom_line(aes(color=countryid), color="dodgerblue1", 
size=1.4)+geom_line(aes(date, reshuffle), color="gray")+ theme_bw()
Run Code Online (Sandbox Code Playgroud)

有没有办法通过专门为标签创建一个列来创建一个标签行?

谢谢!

label r ggplot2

3
推荐指数
1
解决办法
6309
查看次数

网络:使用igraph从事件节点数据制作图形对象

我想从事件注释数据中为igraph创建一个网络对象.

例如,我的数据看起来像这样.

 Event  Person
  1     Obama
  1     Putin
  1     Abe
  1     Cameron 
  2     Putin
  2     Xi
  2     Merkel
  3     Obama
  3     Abe
  3     Xi
  3     Merkel
Run Code Online (Sandbox Code Playgroud)

我假设同一事件中的每个人都有联系.奥巴马,普京,安倍和卡梅伦都有联系,因为他们都参加了比赛.基于这些数据,奥巴马和安倍有两次联系,因为他们都参加了第一场和第三场比赛.

有了这些数据,我想计算度数/中介/亲密度中心性.要计算这些中心点,我需要有一个图形对象.如何创建图形对象或邻接矩阵来计算三个中心度量?

我很抱歉这个基本问题,但我不熟悉使用R进行网络分析.

先感谢您!

networking r igraph

3
推荐指数
1
解决办法
211
查看次数

在python中加载json文件

我正在尝试在python中加载json文件。我的json文件如下所示:

{'awesomeness': 2.5, 'party': 'Republican', 'Age': 50, 'State': 'California', 'Ideology': 0.5,  
'time': {'day': 20, 'mon': 2, 'sec': 3}, 'overall': 9.5, 'review': 'Best Senator ever\tPretty balanced 
view.\tNot sure if he can get reelected'}
{'awesomeness': 0.5, 'party': 'Republican', 'Age': 70, 'State': 'New York', 'Ideology': 0.8,  
'time': {'day': 25, 'mon': 8, 'sec': 31}, 'overall': 5.5, 'review': 'NA'}
Run Code Online (Sandbox Code Playgroud)

这是我的代码。

with open("senator.json") as json_file:
  data = json.load(json_file)
Run Code Online (Sandbox Code Playgroud)

但是我出现了以下错误,

File "<stdin>", line 1, in <module>
File "<string>", line 2, in <module>
File "/System/Library/Frameworks/Python.framework/Versions/2.7/lib/python2.7/json/__init__.py", line 290, in …
Run Code Online (Sandbox Code Playgroud)

python json

2
推荐指数
1
解决办法
6272
查看次数

标签 统计

r ×4

python ×2

data.table ×1

ggplot2 ×1

igraph ×1

json ×1

label ×1

networking ×1

percentage ×1

pip ×1

recode ×1

scikit-learn ×1