小编Cri*_*a23的帖子

Python Matplotlib - 如何在y轴上指定值?

我是Python的新手,我需要使用pyplot和matplotlib生成一个图形,如附图所示.到目前为止,我尝试过这样:

 import matplotlib.pyplot as plt
 import numpy as np

 x = np.array([0,1,2,3])
 y = np.array([20,21,22,23])
 my_xticks = ['John','Arnold','Mavis','Matt']
 plt.xticks(x, my_xticks)
 plt.plot(x, y)
 plt.show()
Run Code Online (Sandbox Code Playgroud)

但我的问题是如何在y轴上指定不同数量的值与x轴上的值数量不同?也许可以将它们指定为0.005差异而不是列表的区间?非常感谢!在此输入图像描述

python plot matplotlib python-2.7

25
推荐指数
1
解决办法
6万
查看次数

Twitter API - 获取具有特定ID的推文

我有一个tweet ID列表,我想下载它们的文本内容.是否有任何简单的解决方案,最好通过Python脚本?我看过像Tweepy这样的其他库,看起来工作起来并不那么简单,因为我的列表很长,所以手动下载它们是不可能的.

python twitter

21
推荐指数
4
解决办法
3万
查看次数

ElasticSearch日期范围

我有以下查询:

{
   "query": {
     "query_string": {
       "query": "searchTerm",
        "default_operator": "AND"
       }
     },
    "facets": {
      "counts": {
        "date_histogram": {
         "field": "firstdate",
         "interval": "hour"
         }
    }
}
Run Code Online (Sandbox Code Playgroud)

我想为它添加一个日期范围,以便检索字段firstdate的值,这些值在特定的from/to interval之内.有关如何做的任何建议?非常感谢!

date-range elasticsearch

14
推荐指数
4
解决办法
5万
查看次数

Scikit在测试集上学习 - fit_transform

我正在努力使用Scikit学习Python中的随机森林.我的问题是我用它进行文本分类(3个类 - 正/负/中性),我提取的特征主要是单词/ unigrams,所以我需要将它们转换为数字特征.我找到了一种方法做它DictVectorizerfit_transform:

from sklearn.preprocessing import LabelEncoder
from sklearn.metrics import classification_report
from sklearn.feature_extraction import DictVectorizer

vec = DictVectorizer(sparse=False)
rf = RandomForestClassifier(n_estimators = 100)
trainFeatures1 = vec.fit_transform(trainFeatures)

# Fit the training data to the training output and create the decision trees
rf = rf.fit(trainFeatures1.toarray(), LabelEncoder().fit_transform(trainLabels))

testFeatures1 = vec.fit_transform(testFeatures)
# Take the same decision trees and run on the test data
Output = rf.score(testFeatures1.toarray(), LabelEncoder().fit_transform(testLabels))

print "accuracy: " + str(Output)
Run Code Online (Sandbox Code Playgroud)

我的问题是该fit_transform方法正在处理火车数据集,其中包含大约8000个实例,但是当我尝试将我的测试集转换为数字特征时,也就是大约80000个实例,我得到一个内存错误,说:

testFeatures1 = vec.fit_transform(testFeatures)
File …
Run Code Online (Sandbox Code Playgroud)

classification machine-learning random-forest scikit-learn text-classification

13
推荐指数
1
解决办法
9204
查看次数

具有最小值,最大值,平均值和标准差的箱形图

我需要创建一个包含某些运行结果的箱形图 - 对于每个运行,我都有最小输出,最大输出,平均输出和标准偏差.这意味着我将需要16个带有标签的箱形图.

到目前为止我遇到的例子描绘了一个数字分布,但在我的情况下,这是不可行的.

在Python(Matplotlib)/ R中有没有办法做到这一点?

python r matplotlib

11
推荐指数
1
解决办法
2万
查看次数

非英语单词的词形还原?

我想应用词形还原来减少词汇的屈折形式.我知道,对于英语WordNet提供了这样的功能,但我也有兴趣将词典化应用于荷兰语,法语,西班牙语和意大利语.有没有值得信赖和确认的方法来解决这个问题?谢谢!

python information-retrieval nltk information-extraction lemmatization

8
推荐指数
1
解决办法
7536
查看次数

Scikit分类报告 - 更改显示结果的格式

Scikit分类报告仅显示两位数的精确度和召回分数.是否有可能使它在点后显示4位数,我的意思是代替0.67显示0.6783?

 from sklearn.metrics import classification_report
 print classification_report(testLabels, p, labels=list(set(testLabels)), target_names=['POSITIVE', 'NEGATIVE', 'NEUTRAL'])
                     precision    recall  f1-score   support

         POSITIVE       1.00      0.82      0.90     41887
         NEGATIVE       0.65      0.86      0.74     19989
         NEUTRAL        0.62      0.67      0.64     10578
Run Code Online (Sandbox Code Playgroud)

另外,我应该担心精度得分为1.00吗?谢谢!

python classification machine-learning svm scikit-learn

6
推荐指数
2
解决办法
4997
查看次数

将变量值后面的代码传递给jQuery函数

我不是jQuery的专家,我试图将一些变量值从C#传递给我在keyup和onclick事件上调用的函数.到目前为止,我有这样的事情:

$('mydiv').bind('keyup click', function(event) {}
Run Code Online (Sandbox Code Playgroud)

但我需要的是:

$('mydiv').bind('keyup click', function(event, UserId, ControlId) {}
Run Code Online (Sandbox Code Playgroud)

,其中UserId和ControlId是我从查询字符串后面的代码中得到的一些ID.我也在使用jQuery 1.6.4.

我怎么能这样做,最好不使用隐藏的输入字段?谢谢.

javascript c# asp.net jquery

5
推荐指数
1
解决办法
1万
查看次数

Scikit学习 - 如何使用SVM和随机森林进行文本分类?

我有一套trainFeatures和一组testFeatures带有正面,中性和负面标签:

trainFeats = negFeats + posFeats + neutralFeats
testFeats  = negFeats + posFeats + neutralFeats
Run Code Online (Sandbox Code Playgroud)

例如,trainFeatsis 里面有一个条目

(['blue', 'yellow', 'green'], 'POSITIVE') 
Run Code Online (Sandbox Code Playgroud)

对于测试功能列表也是如此,因此我为每个集指定了标签.我的问题是如何使用随机森林分类器和SVM的scikit实现来获得这个分类器的准确性与每个类的精确度和召回分数?问题是我目前正在使用单词作为功能,而从我读到的这些分类器需要数字.有没有办法在不改变功能的情况下实现我的目的?非常感谢!

python classification machine-learning scikit-learn

5
推荐指数
1
解决办法
7599
查看次数

如何在Java项目中使用HeidelTime时间标记器?

我想自动识别文档流中的日期,从这个意义上说,我想使用开源项目Heideltime提供的代码,可在此处访问(https://code.google.com/p/heideltime/).我已经安装了Heideltime工具包(不是独立版本),现在我想知道如何引用它并在我的Java项目中调用它.我已经在我的pom.xml中添加了对Heideltime的依赖:

    <dependency>
        <groupId>de.unihd.dbs</groupId>
        <artifactId>heideltime</artifactId>
        <version>1.7</version>
    </dependency>
Run Code Online (Sandbox Code Playgroud)

但是我不确定如何将这个源项目中的类调用到我自己的项目中.我正在使用Maven.之前使用过它的人可能会给我一个建议或建议吗?非常感谢!

java temporal maven heideltime

5
推荐指数
1
解决办法
1475
查看次数