小编mar*_*arc的帖子

在Python中使用Counter()来构建直方图?

我在另一个问题上看到,我可以使用它Counter()来计算一组字符串中出现的次数.所以如果['A','B','A','C','A','A']我得到了Counter({'A':3,'B':1,'C':1}).但是现在,我如何使用该信息来构建直方图?

python histogram

49
推荐指数
2
解决办法
4万
查看次数

在R中是否有类似于Matlab的"关闭所有"的命令?

在Matlab中,我可以close all在脚本的开头使用来关闭绘图以避免堆积数字.

R中有类似的命令吗?

matlab plot r

31
推荐指数
1
解决办法
3万
查看次数

如何检查anaconda包是否已正确安装

我是Python的新手,想用它来进行数据分析.我刚刚在运行OSX 10.8的mac上安装了Python 2.7.我需要NumPy,SciPy,matplotlib和csv包.我读到我可以简单地安装Anaconda软件包并将其全部集成在一起.所以我继续下载/安装了Anaconda 1.7.

但是,当我输入:import numpy as np

我收到一个错误,告诉我没有这样的模块.我认为这与安装位置有关,但我无法弄清楚如何:A.检查所有内容是否已正确安装B.检查安装位置.

任何指针将不胜感激!

谢谢

python macos installation numpy anaconda

21
推荐指数
1
解决办法
6万
查看次数

Grepl在R期间?

可以说我有一个字符串"你好".我想看看这个字符串是否包含句点:

text <- "Hello."
results <- grepl(".", text)
Run Code Online (Sandbox Code Playgroud)

这会将结果返回为TRUE,但如果文本为"Hello",它也会返回该结果.我非常困惑,我在文档中找不到任何关于此内容的内容,并且只在此期间执行此操作.

有任何想法吗?

谢谢!

regex grep r

14
推荐指数
2
解决办法
1万
查看次数

使用randomforest()进行R分类?

我最初有一个由N行12列组成的数据框.最后一列是我的班级(0或1).我不得不将我的整个数据框转换为数字

training <- sapply(training.temp,as.numeric)
Run Code Online (Sandbox Code Playgroud)

但后来我觉得我需要将class列作为因子列来使用randomforest()工具作为分类器,所以我做了

training[,"Class"] <- factor(training[,ncol(training)])
Run Code Online (Sandbox Code Playgroud)

我继续创建树

training_rf <- randomForest(Class ~., data = trainData, importance = TRUE, do.trace = 100)
Run Code Online (Sandbox Code Playgroud)

但我得到两个错误:

1: In Ops.factor(training[, "Status"], factor(training[, ncol(training)])) : 
<= this is not relevant for factors (roughly translated)
2: In randomForest.default(m, y, ...) :
The response has five or fewer unique values.  Are you sure you want to do regression?
Run Code Online (Sandbox Code Playgroud)

如果有人能指出我正在制作的格式错误,我将不胜感激.

谢谢!

r random-forest

10
推荐指数
2
解决办法
1万
查看次数

在Hive/SQL中获取具有最大值的行?

我是Hive/SQL的新手,我遇到了一个相当简单的问题.我的数据如下:

+------------+--------------------+-----------------------+
| carrier_iD |     meandelay      |     meancanceled      |
+------------+--------------------+-----------------------+
| EV         | 13.795802119653473 | 0.028584251044292006  |
| VX         | 0.450591016548463  | 2.364066193853424E-4  |
| F9         | 10.898001378359766 | 0.00206753962784287   |
| AS         | 0.5071547420965062 | 0.0057404326123128135 |
| HA         | 1.2031093279839498 | 5.015045135406214E-4  |
| 9E         | 8.147899230704216  | 0.03876067292247866   |
| B6         | 9.45383857757506   | 0.003162096314343487  |
| UA         | 8.101511665305816  | 0.005467725574605967  |
| FL         | 0.7265068895709532 | 0.0041141513746490044 |
| WN         | 7.156119279121648  | 0.0057419058192869415 | …
Run Code Online (Sandbox Code Playgroud)

sql hive

8
推荐指数
2
解决办法
4万
查看次数

检查该字符串包含两个相同字符的方法?

让我们说:

str = "Hello! My name is Barney!"
Run Code Online (Sandbox Code Playgroud)

是否有一个或两个行方法来检查此字符串是否包含两个!

python string

7
推荐指数
1
解决办法
1万
查看次数

在python中将列表保存到带有两位小数的csv?

我的数据看起来像

[('A',5.3748),('B',8.324203),('C',3.492)]
Run Code Online (Sandbox Code Playgroud)

我将其保存为 csv 文件,其中包含以下几行:

with open('output.csv','wb') as fp:
    a = csv.writer(fp,delimiter = ",")
    a.writerows(data)
Run Code Online (Sandbox Code Playgroud)

工作起来就像一个魅力,只是我想只用两位小数来显示我的值。在我的代码的前面,我压缩两个列表来获取数据。所以如果需要的话我可以提前做出改变。

谢谢!

python csv significant-digits

4
推荐指数
1
解决办法
2万
查看次数

如何根据python中的数组值排序列表?

让我们说:

list = ['apple','banana','pear','orange']
values = [3,1,2,4]
Run Code Online (Sandbox Code Playgroud)

我需要根据"values"向量中的值来排序列表字符串.在MatLab中我会合并两个然后对矢量进行排序,但似乎我不能在这里做到这一点.有任何想法吗?

谢谢!

python list vector

1
推荐指数
1
解决办法
90
查看次数

在python中使用if语句列表?

我有一个如下的单词列表:

old_list = ['houses','babies','cars','apples']
Run Code Online (Sandbox Code Playgroud)

我需要的输出是:

new_list = ['house','baby','car','apple']
Run Code Online (Sandbox Code Playgroud)

为了做到这一点,我提出了一个循环:

new_list1 = []
new_list2 = []
for word in old_list:
    if word.endswith("ies"):
        new_list1[:0] = [word.replace("ies","y")] 
    elif word.endswith("s"):
        new_list2[:0] = [word.replace(' ','')[:-1]]

new_list = new_list1 + new_list2 # Order doesn't matter, but len(new_list) == len(old_list)
Run Code Online (Sandbox Code Playgroud)

它根本不起作用.我得到的东西是这样的:

new_list = ['baby','house','babie','car','apple']
Run Code Online (Sandbox Code Playgroud)

我确定我只是犯了一个简单的错误,但我看不到它.如果有一种简单的方法可以实现它,我会使用list.append().

谢谢!

python if-statement list

1
推荐指数
2
解决办法
442
查看次数

用python中的函数解压缩的值太多了?

我有这样的文字:

text = ["A/abc","B/abd","C/abc","D/xyz"]
Run Code Online (Sandbox Code Playgroud)

我想要的输出是

 mylist1 = ["A","C"]
 mylist2 = ["B"]
 mylist3 = ["D"]
Run Code Online (Sandbox Code Playgroud)

我正在寻找的唯一标签是"/ abc"和"/ abd"

现在我拥有的是:

def searchWord(segment):
    word_tag = segment.split('/')

    if re.finditer('ab',word_tag[1]):
        if re.finditer('abc',word_tag[1]):
            letter = word_tag[0]
            mylist1 = letter
        else:
            letter = word_tag[0]
            mylist2 = letter
    else:
        letter = word_tag[0]
        mylist3 = letter

    return mylist1
    return mylist2
    return mylist3

mylist1,mylist2,mylist3 = [searchWord(segment) for segment in text]
Run Code Online (Sandbox Code Playgroud)

它似乎工作正常,但抛出异常:

 ValueError: too many values to unpack.
Run Code Online (Sandbox Code Playgroud)

我的"文本"列表相当大,这可能是问题吗?在为此过程构建函数之前,我没有遇到此问题.

谢谢!

python error-handling list

0
推荐指数
1
解决办法
6692
查看次数