小编gol*_*ine的帖子

如何在python中的散点图上绘制一条线？

我有两个数据向量,我已将它们放入matplotlib.scatter().现在,我想过度拟合这些数据的线性拟合.我该怎么做？我尝试过使用scikitlearn和np.scatter.

python numpy matplotlib

gol*_*ine

2013 10-03

58
推荐指数

6
解决办法

13万
查看次数

转义正则表达式以获得有效的JSON

在我的架构中,我想识别某些模式以限制用户可以输入的数据类型.我用正则表达式来限制哪些用户可以进入,但是当我尝试使用在线验证这样来验证JSON的正则表达式得到标记一个.

有没有办法让验证器忽略不同意它的正则表达式特殊字符,但仍保留正则表达式？

奇怪的是验证器只在某些情况下跳闸.例如,它标记第二个而不是正则表达式的第一个实例,尽管它们在这里是相同的:

            "institutionname": {
                "type": "string",
                "description": "institution name",
                "label": "name",
                "input-type": "text",
                "pattern": "^[A-Za-z0-9\s]+$"
            },
            "bio": {
                "type": "string",
                "label": "bio",
                "input-type": "text",
                "pattern": "^[A-Za-z0-9\s]+$",
                "help-box": "tell us about yourself"
            },

Run Code Online (Sandbox Code Playgroud)

schema json

gol*_*ine

lucky-day

28
推荐指数

2
解决办法

3万
查看次数

删除除了一列pandas数据帧之外的所有内容？

我有一个pandas数据帧,并希望删除所有列保存索引和一个名为'bob'的列

我该怎么做？

python pandas

gol*_*ine

2018 11-01

21
推荐指数

2
解决办法

8549
查看次数

如何使用ggplot2生成饼图？

我有一个值向量,我想将其显示为饼图.矢量由1,2和3组成,我希望我的饼图显示矢量中1,2和3的百分比以及区域的标签.1是民主党人,2人是共和党人,3人是独立党人.我一直在使用的向量是数据帧的列.虽然我使用as.numeric()和as.factor()传递了它,但可能存在一些类型问题.

这是df的一个例子(注意,正如你在代码中看到的那样,我在第7章中有所讨论):

  Q6 Q7 Q8 Q9
3 30  3  5  1
4 30  3  5  1
5 65  3  2  2
6 29  3  5  1
7 23  1  4  1
8 24  1  5  1

Run Code Online (Sandbox Code Playgroud)

这是我一直在尝试的代码:

install.packages('ggplot2')
library(ggplot2)

# pie graph for party
pie <- ggplot(data=data, aes(x = as.factor(data$Q7), fill = factor(cyl)))
pie + coord_polar(theta = "y")

Run Code Online (Sandbox Code Playgroud)

它返回一个错误:'没有图中的图层'

谢谢您的帮助!

r ggplot2

gol*_*ine

2013 12-07

18
推荐指数

1
解决办法

3万
查看次数

如何表示分类预测器rstan？

格式化分类预测器以在STAN中使用的正确方法是什么？我似乎无法将分类预测器输入为正常因子变量,那么转换正常分类变量以便STAN可以接受它的最快方法是什么？

例如,假设我有一个继续预测器和类似这样的分类预测器:

     income      country
1  62085.59      England
2  60806.33      England
3  60527.27      England
4  67112.64          USA
5  57675.92          USA
6  58128.44          USA
7  60822.47 South Africa
8  55805.80 South Africa
9  63982.99 South Africa
10 64555.45      Belgium

Run Code Online (Sandbox Code Playgroud)

我如何准备将其输入rstan？

r dataframe stan rstan

gol*_*ine

2015 03-21

13
推荐指数

2
解决办法

4756
查看次数

将列表转换为小写

我想在input.txt中获取这一列的单词:

Suzuki music
Chinese music
Conservatory
Blue grass
Rock n roll
Rhythm
Composition
Contra
Instruments

Run Code Online (Sandbox Code Playgroud)

进入这种格式:

"suzuki music", "chinese music", "conservatory music", "blue grass", "rock n roll", "rhythm"...

Run Code Online (Sandbox Code Playgroud)

这段代码:

with open ('artsplus_stuff.txt', 'r') as f:
    list.append(", ".join(['%s' % row for row in f.read().splitlines()]))
    for item in list:
        item.lower()

print list

Run Code Online (Sandbox Code Playgroud)

返回一个列表,但第一个字母大写.

['铃木音乐,中国音乐,音乐学院,蓝草,摇滚,节奏,作曲,对比,乐器']

如何将所有物品放低？

谢谢!

答案不在此列表中:

Chess
Guitar
Woodworking
Gardening
Car_restoration
Metalworking
Marksman
Camping
Backpacking_(wilderness)
Hunting
Fishing
Whittling
Geocaching
Sports
Model_Building
Leatherworking
Bowling
Archery
Hiking
Connoisseur
Photography
Pool_(cue_sports)
Mountaineering
Cooking
Blacksmith …

Run Code Online (Sandbox Code Playgroud)

python

gol*_*ine

2013 06-27

12
推荐指数

2
解决办法

5万
查看次数

从R中的数据框中获取具有多个单独观察的组级观察计数

我如何得到这样的数据帧:

soccer_player country position
"sam"         USA     left defender
"jon"         USA     right defender
"sam"         USA     left midfielder
"jon"         USA     offender
"bob"         England goalie
"julie"       England central midfielder
"jane"        England goalie

Run Code Online (Sandbox Code Playgroud)

看起来像这样(每个国家/地区拥有独特玩家数量的国家/地区):

country player_count
USA     2
England 3

Run Code Online (Sandbox Code Playgroud)

显而易见的复杂因素是每个玩家有多个观察,所以我不能简单table(df$country)地获得每个国家的观察数量.

我一直在玩table()和merge()功能,但没有运气.

r dataframe

gol*_*ine

2014 10-14

11
推荐指数

3
解决办法

2万
查看次数

如何从回归树rpart对象生成预测区间？

如何从使用rpart的回归树生成预测区间？

据我所知,回归树以叶节点的平均值为条件对响应进行建模.我不知道如何从模型中获得叶节点的方差,但我想要做的是使用叶节点的均值和方差来模拟以获得预测间隔.

Predict.rpart()没有给出interval的选项.

示例:我使用虹膜数据拟合树,但是预测没有选项,"间隔"

> r1 <- rpart(Sepal.Length ~ ., cp = 0.001, data = iris[1:nrow(iris)-1,])
> predict(r1,newdata=iris[nrow(iris),],type = "interval")
Error in match.arg(type) : 
  'arg' should be one of “vector”, “prob”, “class”, “matrix”

Run Code Online (Sandbox Code Playgroud)

tree r prediction

gol*_*ine

lucky-day

9
推荐指数

1
解决办法

4543
查看次数

Gephi中的并行边缘是什么？如何在导入边缘列表时处理它们？

当我导入.gexf文件时,它会标记一堆平行边.我不知道平行边是什么以及为什么我的图有问题.我正在尝试创建一个动态的gephi图.

在此输入图像描述

gephi

gol*_*ine

lucky-day

8
推荐指数

1
解决办法

4231
查看次数

包含NA的数据的群集标准错误

我无法使用基于此帖子的 R和指导来聚类标准错误.cl函数返回错误:

Error in tapply(x, cluster1, sum) : arguments must have same length

Run Code Online (Sandbox Code Playgroud)

在阅读之后,tapply我仍然不确定为什么我的群集参数是错误的长度,以及导致此错误的原因.

这是我正在使用的数据集的链接.

https://www.dropbox.com/s/y2od7um9pp4vn0s/Ec%201820%20-%20DD%20Data%20with%20Controls.csv

这是R代码:

# read in data
charter<-read.csv(file.choose())
View(charter)
colnames(charter)

# standardize NAEP scores
charter$naep.standardized <- (charter$naep - mean(charter$naep, na.rm=T))/sd(charter$naep, na.rm=T)

# change NAs in year.passed column to 2014
charter$year.passed[is.na(charter$year.passed)]<-2014

# Add column with indicator for in treatment (passed legislation)
charter$treatment<-ifelse(charter$year.passed<=charter$year,1,0)

# fit model
charter.model<-lm(naep ~ factor(year) + factor(state) + treatment, data = charter)
summary(charter.model)
# account for clustered standard errors by state …

Run Code Online (Sandbox Code Playgroud)

regression r standard-error

gol*_*ine

2015 09-12

7
推荐指数

1
解决办法

3273
查看次数