小编use*_*242的帖子

正则表达式匹配所有货币符号?

是否存在与HTML中出现的所有货币符号(不仅仅是$)相匹配的常规表达式?我试图从html页面中提取所有金额.谢谢!

regex r

10
推荐指数
1
解决办法
6792
查看次数

R randomForest用于分类

我正在尝试使用randomForest进行分类,但我反复收到一条错误消息,似乎没有明显的解决方案(randomForest对我来说在过去做回归效果很好).我在下面粘贴了我的代码."成功"是一个因素,所有因变量都是数字.有关如何正确运行此分类的任何建议?

> rf_model<-randomForest(success~.,data=data.train,xtest=data.test[,2:9],ytest=data.test[,1],importance=TRUE,proximity=TRUE)

Error in randomForest.default(m, y, ...) : 
  NA/NaN/Inf in foreign function call (arg 1)
Run Code Online (Sandbox Code Playgroud)

另外,这是一个数据集的示例:

头(数据)

success duration  goal reward_count updates_count comments_count backers_count     min_reward_level max_reward_level
True 20.00000  1500           10            14              2            68                1             1000
True 30.00000  3000           10             4              3            48                5             1000
True 24.40323 14000           23             6             10           540                5             1250
True 31.95833 30000            9            17              7           173                1            10000
True 28.13211  4000           10            23             97          2936               10              550
True 30.00000  6000           16            16            130          2043               25 …
Run Code Online (Sandbox Code Playgroud)

r classification data-analysis random-forest

7
推荐指数
3
解决办法
2万
查看次数

使用dict.fromkeys()禁用自动dict排序?

def parse_urls(weeks_urls):
    for wkey in weeks_urls.keys():
        results=urllib2.urlopen(weeks_urls[wkey])
        lines = list(csv.reader(results))
        lines=clean_lines(lines)
        week_dict=dict.fromkeys(lines[i][1] for i in range(len(lines)))
        fare_data=list((lines[i][1:]) for i in range(3,len(lines)))
        fare_data=get_fare_data(fare_data)
        n=3
        for station in week_dict: .....
.......
Run Code Online (Sandbox Code Playgroud)

当我用来dict.fromkeys( )从字符串列表中生成一个字典时,它会自动对它们进行排序,从而按字母顺序生成一个带字符串的字典.我需要保留字符串的原始顺序.有没有办法做到这一点?

感谢这里的任何帮助

谢谢!

python dictionary data-analysis

5
推荐指数
1
解决办法
3650
查看次数

从元组列表中的python bar plot

非常新手的问题:

我需要从元组列表中绘制条形图.第一个元素是x轴的名称(分类),第二个元素是float类型(对于y轴).我还想按降序排列条形图,并添加趋势线.以下是一些示例代码:

In [20]: popularity_data
Out[20]: 
[('Unknown', 10.0),
 (u'Drew E.', 240.0),
 (u'Anthony P.', 240.0),
 (u'Thomas H.', 220.0),
 (u'Ranae J.', 150.0),
 (u'Robert T.', 120.0),
 (u'Li Yan M.', 80.0),
 (u'Raph D.', 210.0)]
Run Code Online (Sandbox Code Playgroud)

python matplotlib data-analysis

1
推荐指数
1
解决办法
8849
查看次数

通过当前目录中的所有子目录循环脚本?

我想象这采取for循环的形式吗?我大约有100行代码可以读取csv,并将其内容添加到数据框中,但是我需要遍历当前工作目录中的所有子目录

loops for-loop r dataframe

0
推荐指数
1
解决办法
1976
查看次数