我在另一个问题上看到,我可以使用它Counter()
来计算一组字符串中出现的次数.所以如果['A','B','A','C','A','A']
我得到了Counter({'A':3,'B':1,'C':1})
.但是现在,我如何使用该信息来构建直方图?
在Matlab中,我可以close all
在脚本的开头使用来关闭绘图以避免堆积数字.
R中有类似的命令吗?
我是Python的新手,想用它来进行数据分析.我刚刚在运行OSX 10.8的mac上安装了Python 2.7.我需要NumPy,SciPy,matplotlib和csv包.我读到我可以简单地安装Anaconda软件包并将其全部集成在一起.所以我继续下载/安装了Anaconda 1.7.
但是,当我输入:import numpy as np
我收到一个错误,告诉我没有这样的模块.我认为这与安装位置有关,但我无法弄清楚如何:A.检查所有内容是否已正确安装B.检查安装位置.
任何指针将不胜感激!
谢谢
可以说我有一个字符串"你好".我想看看这个字符串是否包含句点:
text <- "Hello."
results <- grepl(".", text)
Run Code Online (Sandbox Code Playgroud)
这会将结果返回为TRUE,但如果文本为"Hello",它也会返回该结果.我非常困惑,我在文档中找不到任何关于此内容的内容,并且只在此期间执行此操作.
有任何想法吗?
谢谢!
我最初有一个由N行12列组成的数据框.最后一列是我的班级(0或1).我不得不将我的整个数据框转换为数字
training <- sapply(training.temp,as.numeric)
Run Code Online (Sandbox Code Playgroud)
但后来我觉得我需要将class列作为因子列来使用randomforest()工具作为分类器,所以我做了
training[,"Class"] <- factor(training[,ncol(training)])
Run Code Online (Sandbox Code Playgroud)
我继续创建树
training_rf <- randomForest(Class ~., data = trainData, importance = TRUE, do.trace = 100)
Run Code Online (Sandbox Code Playgroud)
但我得到两个错误:
1: In Ops.factor(training[, "Status"], factor(training[, ncol(training)])) :
<= this is not relevant for factors (roughly translated)
2: In randomForest.default(m, y, ...) :
The response has five or fewer unique values. Are you sure you want to do regression?
Run Code Online (Sandbox Code Playgroud)
如果有人能指出我正在制作的格式错误,我将不胜感激.
谢谢!
我是Hive/SQL的新手,我遇到了一个相当简单的问题.我的数据如下:
+------------+--------------------+-----------------------+
| carrier_iD | meandelay | meancanceled |
+------------+--------------------+-----------------------+
| EV | 13.795802119653473 | 0.028584251044292006 |
| VX | 0.450591016548463 | 2.364066193853424E-4 |
| F9 | 10.898001378359766 | 0.00206753962784287 |
| AS | 0.5071547420965062 | 0.0057404326123128135 |
| HA | 1.2031093279839498 | 5.015045135406214E-4 |
| 9E | 8.147899230704216 | 0.03876067292247866 |
| B6 | 9.45383857757506 | 0.003162096314343487 |
| UA | 8.101511665305816 | 0.005467725574605967 |
| FL | 0.7265068895709532 | 0.0041141513746490044 |
| WN | 7.156119279121648 | 0.0057419058192869415 | …
Run Code Online (Sandbox Code Playgroud) 让我们说:
str = "Hello! My name is Barney!"
Run Code Online (Sandbox Code Playgroud)
是否有一个或两个行方法来检查此字符串是否包含两个!
?
我的数据看起来像
[('A',5.3748),('B',8.324203),('C',3.492)]
Run Code Online (Sandbox Code Playgroud)
我将其保存为 csv 文件,其中包含以下几行:
with open('output.csv','wb') as fp:
a = csv.writer(fp,delimiter = ",")
a.writerows(data)
Run Code Online (Sandbox Code Playgroud)
工作起来就像一个魅力,只是我想只用两位小数来显示我的值。在我的代码的前面,我压缩两个列表来获取数据。所以如果需要的话我可以提前做出改变。
谢谢!
让我们说:
list = ['apple','banana','pear','orange']
values = [3,1,2,4]
Run Code Online (Sandbox Code Playgroud)
我需要根据"values"向量中的值来排序列表字符串.在MatLab中我会合并两个然后对矢量进行排序,但似乎我不能在这里做到这一点.有任何想法吗?
谢谢!
我有一个如下的单词列表:
old_list = ['houses','babies','cars','apples']
Run Code Online (Sandbox Code Playgroud)
我需要的输出是:
new_list = ['house','baby','car','apple']
Run Code Online (Sandbox Code Playgroud)
为了做到这一点,我提出了一个循环:
new_list1 = []
new_list2 = []
for word in old_list:
if word.endswith("ies"):
new_list1[:0] = [word.replace("ies","y")]
elif word.endswith("s"):
new_list2[:0] = [word.replace(' ','')[:-1]]
new_list = new_list1 + new_list2 # Order doesn't matter, but len(new_list) == len(old_list)
Run Code Online (Sandbox Code Playgroud)
它根本不起作用.我得到的东西是这样的:
new_list = ['baby','house','babie','car','apple']
Run Code Online (Sandbox Code Playgroud)
我确定我只是犯了一个简单的错误,但我看不到它.如果有一种简单的方法可以实现它,我会使用list.append().
谢谢!
我有这样的文字:
text = ["A/abc","B/abd","C/abc","D/xyz"]
Run Code Online (Sandbox Code Playgroud)
我想要的输出是
mylist1 = ["A","C"]
mylist2 = ["B"]
mylist3 = ["D"]
Run Code Online (Sandbox Code Playgroud)
我正在寻找的唯一标签是"/ abc"和"/ abd"
现在我拥有的是:
def searchWord(segment):
word_tag = segment.split('/')
if re.finditer('ab',word_tag[1]):
if re.finditer('abc',word_tag[1]):
letter = word_tag[0]
mylist1 = letter
else:
letter = word_tag[0]
mylist2 = letter
else:
letter = word_tag[0]
mylist3 = letter
return mylist1
return mylist2
return mylist3
mylist1,mylist2,mylist3 = [searchWord(segment) for segment in text]
Run Code Online (Sandbox Code Playgroud)
它似乎工作正常,但抛出异常:
ValueError: too many values to unpack.
Run Code Online (Sandbox Code Playgroud)
我的"文本"列表相当大,这可能是问题吗?在为此过程构建函数之前,我没有遇到此问题.
谢谢!