小编Kub*_*888的帖子

如何使用tweepy.Cursor和api.search从Tweepy中提取Hashtags?

Tweepy通过应用tweepy.Cursor和api.search方法(如下所示)提取了我需要的所有其他信息(除了主题标签).我从文档中知道Hashtags属于这种结构Status> entities> hashtags.我试图找到(下面)方法中的"hashtags"目录,但无济于事:

print "tweet", dir(tweet)
print "////////////////"
print "tweet._api", dir(tweet._api)
print "////////////////"
print "tweet.text", dir(tweet.text)
print "////////////////"
print "tweet.entities", dir(tweet.entities)
print "////////////////"
print "tweet.author", dir(tweet.author)
print "////////////////"
print "tweet.user", dir(tweet.user)
Run Code Online (Sandbox Code Playgroud)

我的代码在这里:

import tweepy

ckey = ""
csecret = ""
atoken = ""
asecret = ""

OAUTH_KEYS = {'consumer_key':ckey, 'consumer_secret':csecret,
    'access_token_key':atoken, 'access_token_secret':asecret}
auth = tweepy.OAuthHandler(OAUTH_KEYS['consumer_key'], OAUTH_KEYS['consumer_secret'])
api = tweepy.API(auth)

for tweet in tweepy.Cursor(api.search, q=('"good book"'), since='2014-09-16', until='2014-09-17').items(5):

    print "Name:", tweet.author.name.encode('utf8')
    print "Screen-name:", tweet.author.screen_name.encode('utf8')
    print "Tweet created:", tweet.created_at
    print "Tweet:", tweet.text.encode('utf8') …
Run Code Online (Sandbox Code Playgroud)

twitter tweepy python-2.7 hashtag

5
推荐指数
1
解决办法
9782
查看次数


从Python NLTK或其他模块中的任何单词获取音素?

Python NLTK的命令会吐出已识别单词的音素。例如'see'-> [u'S',u'IY1'],但是对于无法识别的单词会给出错误。例如'seasee'->错误。

import nltk

arpabet = nltk.corpus.cmudict.dict()

for word in ('s', 'see', 'sea', 'compute', 'comput', 'seesea'):
    try:
        print arpabet[word][0]
    except Exception as e:
        print e

#Output
[u'EH1', u'S']
[u'S', u'IY1']
[u'S', u'IY1']
[u'K', u'AH0', u'M', u'P', u'Y', u'UW1', u'T']
'comput'
'seesea'
Run Code Online (Sandbox Code Playgroud)

是否有没有那个限制但能够找到/猜测任何真实或虚构单词的音素的模块?

如果没有,我有什么办法可以对其编程?我正在考虑做循环以测试单词的递增部分。例如,在“ seasee”中,第一个循环使用“ s”,下一个循环使用“ se”,第三个循环使用“ sea” ...等等,并运行命令。尽管问题是我不知道该如何发信号,但这是需要考虑的正确音素。例如,“ seasee”中的“ s”和“ sea”都将输出一些有效音素。

工作进程:

import nltk

arpabet = nltk.corpus.cmudict.dict()

for word in ('s', 'see', 'sea', 'compute', 'comput', 'seesea', 'darfasasawwa'):
    try:
        phone = arpabet[word][0]
    except:
        try:
            counter = 0
            for i in …
Run Code Online (Sandbox Code Playgroud)

nltk python-2.7

5
推荐指数
2
解决办法
5025
查看次数

如何在 Kivy 中添加滚动文本小部件?

我是新来的基维。我想创建一个接受用户文本输入的应用程序,然后显示它。但是当用户输入很长时,我希望显示区域可以滚动。

我已经做了一些教程,可以分别做这两件事,但是我很难把它们放在一起。

这是允许可滚动文本的代码:

__version__ = '1.0.1'

from kivy.app import App
from kivy.uix.boxlayout import BoxLayout
from kivy.uix.button import Button
from kivy.uix.widget import Widget
from kivy.uix.label import Label
from kivy.uix.textinput import TextInput
from kivy.uix.scrollview import ScrollView
import warnings
import string
from kivy.base import runTouchApp
from kivy.lang import Builder
from kivy.properties import StringProperty

Builder.load_string('''
<ScrolllabelLabel>:
    Label:
        text: root.text
        font_size: 50
        text_size: self.width, None
        size_hint_y: None
        height: self.texture_size[1]
''')

class ScrolllabelLabel(ScrollView):
    text = StringProperty('srgsdrgsdfh dsfg dvgf vgsdfv srfvsdfsdrfv sevrv sdrfv serv serv serv servsrd …
Run Code Online (Sandbox Code Playgroud)

android scroll scrollview python-2.7 kivy

5
推荐指数
1
解决办法
4239
查看次数

如何使用 Pandas groupby() 将列的逗号分隔项的字符串聚合到列表中?

我有如下数据:

NAME    ETHNICITY_RECAT TOTAL_LENGTH    3LETTER_SUBSTRINGS
joseph  fr              14              jos, ose, sep, eph
ann     en              16              ann
anne    ir              14              ann, nne
tom     en              18              tom
tommy   fr              16              tom, omm, mmy
ann     ir              19              ann
... more rows
Run Code Online (Sandbox Code Playgroud)

3LETTER_SUBSTRINGS 值是字符串,它捕获 NAME 变量的所有 3 字母子字符串。我想将它聚合到一个列表中,每个逗号分隔的项目按每一行附加到列表中,并被视为一个列表项。如下:

ETHNICITY_RECAT TOTAL_LENGTH            3LETTER_SUBSTRINGS
                min max mean            <lambda>
fr              2   26  13.22           [jos, ose, sep, eph, tom, oom, mmy, ...]
en              3   24  11.92           [ann, tom, ...]
ir              4   23  12.03           [ann, nne, ann, ...]
Run Code Online (Sandbox Code Playgroud)

我使用以下代码“完成”了它:

aggregations …
Run Code Online (Sandbox Code Playgroud)

aggregation python-3.x pandas pandas-groupby

5
推荐指数
1
解决办法
794
查看次数

删除python中字符串上的任何单个字母

我想删除python中字符串中的任何单个字母.

例如:

input: 'z 23rwqw a 34qf34 h 343fsdfd'
output: '23rwqw 34qf34 343fsdfd'
Run Code Online (Sandbox Code Playgroud)

试图用正则表达式弄清楚一段时间没有成功.我知道如何将某些字符/符号中的东西分成两部分,而不是我想要做的事情.

我一直在修修补补

re.sub(r'^[^ ]*', '', text)
Run Code Online (Sandbox Code Playgroud)

regex string text python-2.7

4
推荐指数
3
解决办法
7219
查看次数

matplotlib中来自同一循环的两个不同的图?

我特别想用一个循环创建两个不同的图.一个图应该有来自xy的四条直线,而另一个图应该有来自x-y2的四条成角度的线.我的代码只显示一个图中的所有内容.我不太明白plt是如何工作的,我怎样才能创建两个不同的plt对象?

import matplotlib.pyplot as plt
import matplotlib.pyplot as plt2

x=[[1,2,3,4],[1,2,3,4],[1,2,3,4],[1,2,3,4]]
y=[[1,2,3,4],[2,3,4,5],[3,4,5,6],[7,8,9,10]]
y2=[[11,12,13,24],[42,33,34,65],[23,54,65,86],[77,90,39,54]]
colours=['r','g','b','k']

for i in range(len(x)):
   plt.plot(x[i],y2[i],colours[i])
   plt2.plot(x[i],y[i],colours[i])

plt.show()
plt2.show()
Run Code Online (Sandbox Code Playgroud)

python matplotlib python-2.7

4
推荐指数
1
解决办法
3429
查看次数

在Python Pandas中以长格式附加列表元素

我有以下数据:

study_id       list_value
1              ['aaa', 'bbb']
1              ['aaa']
1              ['ccc']
2              ['ddd', 'eee', 'aaa']
2              np.NaN
2              ['zzz', 'aaa', 'bbb']
Run Code Online (Sandbox Code Playgroud)

我怎样才能将它转换成这样的东西?

study_id       list_value
1              ['aaa', 'bbb', 'ccc']
1              ['aaa', 'bbb', 'ccc']
1              ['aaa', 'bbb', 'ccc']
2              ['aaa', 'bbb', 'ddd', 'eee', 'zzz'] 
2              ['aaa', 'bbb', 'ddd', 'eee', 'zzz'] 
2              ['aaa', 'bbb', 'ddd', 'eee', 'zzz'] # order of list item doesn't matter
Run Code Online (Sandbox Code Playgroud)

python list dataframe python-3.x pandas

4
推荐指数
2
解决办法
89
查看次数

如何在使用Python的numpy随机选择时指定随机种子?

我有四个字符串的列表。然后在Pandas数据框中,我想创建一个变量,从该列表中随机选择一个值,并将其分配给每一行。我使用的是numpy的随机选择,但阅读他们的文档,没有种子选项。如何为随机分配指定随机种子,以便每次随机分配都相同?

service_code_options = ['899.59O', '12.42R', '13.59P', '204.68L']
df['SERVICE_CODE'] = [np.random.choice(service_code_options ) for i in df.index]
Run Code Online (Sandbox Code Playgroud)

random numpy python-3.x pandas

4
推荐指数
1
解决办法
1663
查看次数

如何使输出窗口的内容始终滚动到底部?

我来自PyCharm,从VSCode开始,当我在VSCode中的输出窗口打印很多内容时,输出窗口会停留在最后执行内容的输出,我需要一直向下滚动才能看到新输出内容的最后一部分。

有没有办法设置让输出窗口自动转到输出内容的底部?我用谷歌搜索并搜索了 stackoverflow,但没有任何运气。

这是一些视觉效果来展示我的意思

在此输入图像描述

我需要手动向下滚动才能看到最后的内容

在此输入图像描述

visual-studio-code

4
推荐指数
1
解决办法
1126
查看次数