Tweepy通过应用tweepy.Cursor和api.search方法(如下所示)提取了我需要的所有其他信息(除了主题标签).我从文档中知道Hashtags属于这种结构Status> entities> hashtags.我试图找到(下面)方法中的"hashtags"目录,但无济于事:
print "tweet", dir(tweet)
print "////////////////"
print "tweet._api", dir(tweet._api)
print "////////////////"
print "tweet.text", dir(tweet.text)
print "////////////////"
print "tweet.entities", dir(tweet.entities)
print "////////////////"
print "tweet.author", dir(tweet.author)
print "////////////////"
print "tweet.user", dir(tweet.user)
Run Code Online (Sandbox Code Playgroud)
我的代码在这里:
import tweepy
ckey = ""
csecret = ""
atoken = ""
asecret = ""
OAUTH_KEYS = {'consumer_key':ckey, 'consumer_secret':csecret,
'access_token_key':atoken, 'access_token_secret':asecret}
auth = tweepy.OAuthHandler(OAUTH_KEYS['consumer_key'], OAUTH_KEYS['consumer_secret'])
api = tweepy.API(auth)
for tweet in tweepy.Cursor(api.search, q=('"good book"'), since='2014-09-16', until='2014-09-17').items(5):
print "Name:", tweet.author.name.encode('utf8')
print "Screen-name:", tweet.author.screen_name.encode('utf8')
print "Tweet created:", tweet.created_at
print "Tweet:", tweet.text.encode('utf8') …Run Code Online (Sandbox Code Playgroud) 我已经检查http://www.lfd.uci.edu/~gohlke/pythonlibs/,http://help.arcgis.com/en/arcgisdesktop/10.0/help/index.html#//003m00000002000000.htm和https://pypi.python.org/pypi/pygeoif/0.4.1
这些逻辑位置都不能下载arcpy进行安装.我也试过Pip install arcpy.什么都行不通.
Python NLTK的命令会吐出已识别单词的音素。例如'see'-> [u'S',u'IY1'],但是对于无法识别的单词会给出错误。例如'seasee'->错误。
import nltk
arpabet = nltk.corpus.cmudict.dict()
for word in ('s', 'see', 'sea', 'compute', 'comput', 'seesea'):
try:
print arpabet[word][0]
except Exception as e:
print e
#Output
[u'EH1', u'S']
[u'S', u'IY1']
[u'S', u'IY1']
[u'K', u'AH0', u'M', u'P', u'Y', u'UW1', u'T']
'comput'
'seesea'
Run Code Online (Sandbox Code Playgroud)
是否有没有那个限制但能够找到/猜测任何真实或虚构单词的音素的模块?
如果没有,我有什么办法可以对其编程?我正在考虑做循环以测试单词的递增部分。例如,在“ seasee”中,第一个循环使用“ s”,下一个循环使用“ se”,第三个循环使用“ sea” ...等等,并运行命令。尽管问题是我不知道该如何发信号,但这是需要考虑的正确音素。例如,“ seasee”中的“ s”和“ sea”都将输出一些有效音素。
工作进程:
import nltk
arpabet = nltk.corpus.cmudict.dict()
for word in ('s', 'see', 'sea', 'compute', 'comput', 'seesea', 'darfasasawwa'):
try:
phone = arpabet[word][0]
except:
try:
counter = 0
for i in …Run Code Online (Sandbox Code Playgroud) 我是新来的基维。我想创建一个接受用户文本输入的应用程序,然后显示它。但是当用户输入很长时,我希望显示区域可以滚动。
我已经做了一些教程,可以分别做这两件事,但是我很难把它们放在一起。
这是允许可滚动文本的代码:
__version__ = '1.0.1'
from kivy.app import App
from kivy.uix.boxlayout import BoxLayout
from kivy.uix.button import Button
from kivy.uix.widget import Widget
from kivy.uix.label import Label
from kivy.uix.textinput import TextInput
from kivy.uix.scrollview import ScrollView
import warnings
import string
from kivy.base import runTouchApp
from kivy.lang import Builder
from kivy.properties import StringProperty
Builder.load_string('''
<ScrolllabelLabel>:
Label:
text: root.text
font_size: 50
text_size: self.width, None
size_hint_y: None
height: self.texture_size[1]
''')
class ScrolllabelLabel(ScrollView):
text = StringProperty('srgsdrgsdfh dsfg dvgf vgsdfv srfvsdfsdrfv sevrv sdrfv serv serv serv servsrd …Run Code Online (Sandbox Code Playgroud) 我有如下数据:
NAME ETHNICITY_RECAT TOTAL_LENGTH 3LETTER_SUBSTRINGS
joseph fr 14 jos, ose, sep, eph
ann en 16 ann
anne ir 14 ann, nne
tom en 18 tom
tommy fr 16 tom, omm, mmy
ann ir 19 ann
... more rows
Run Code Online (Sandbox Code Playgroud)
3LETTER_SUBSTRINGS 值是字符串,它捕获 NAME 变量的所有 3 字母子字符串。我想将它聚合到一个列表中,每个逗号分隔的项目按每一行附加到列表中,并被视为一个列表项。如下:
ETHNICITY_RECAT TOTAL_LENGTH 3LETTER_SUBSTRINGS
min max mean <lambda>
fr 2 26 13.22 [jos, ose, sep, eph, tom, oom, mmy, ...]
en 3 24 11.92 [ann, tom, ...]
ir 4 23 12.03 [ann, nne, ann, ...]
Run Code Online (Sandbox Code Playgroud)
我使用以下代码“完成”了它:
aggregations …Run Code Online (Sandbox Code Playgroud) 我想删除python中字符串中的任何单个字母.
例如:
input: 'z 23rwqw a 34qf34 h 343fsdfd'
output: '23rwqw 34qf34 343fsdfd'
Run Code Online (Sandbox Code Playgroud)
试图用正则表达式弄清楚一段时间没有成功.我知道如何将某些字符/符号中的东西分成两部分,而不是我想要做的事情.
我一直在修修补补
re.sub(r'^[^ ]*', '', text)
Run Code Online (Sandbox Code Playgroud) 我特别想用一个循环创建两个不同的图.一个图应该有来自xy的四条直线,而另一个图应该有来自x-y2的四条成角度的线.我的代码只显示一个图中的所有内容.我不太明白plt是如何工作的,我怎样才能创建两个不同的plt对象?
import matplotlib.pyplot as plt
import matplotlib.pyplot as plt2
x=[[1,2,3,4],[1,2,3,4],[1,2,3,4],[1,2,3,4]]
y=[[1,2,3,4],[2,3,4,5],[3,4,5,6],[7,8,9,10]]
y2=[[11,12,13,24],[42,33,34,65],[23,54,65,86],[77,90,39,54]]
colours=['r','g','b','k']
for i in range(len(x)):
plt.plot(x[i],y2[i],colours[i])
plt2.plot(x[i],y[i],colours[i])
plt.show()
plt2.show()
Run Code Online (Sandbox Code Playgroud) 我有以下数据:
study_id list_value
1 ['aaa', 'bbb']
1 ['aaa']
1 ['ccc']
2 ['ddd', 'eee', 'aaa']
2 np.NaN
2 ['zzz', 'aaa', 'bbb']
Run Code Online (Sandbox Code Playgroud)
我怎样才能将它转换成这样的东西?
study_id list_value
1 ['aaa', 'bbb', 'ccc']
1 ['aaa', 'bbb', 'ccc']
1 ['aaa', 'bbb', 'ccc']
2 ['aaa', 'bbb', 'ddd', 'eee', 'zzz']
2 ['aaa', 'bbb', 'ddd', 'eee', 'zzz']
2 ['aaa', 'bbb', 'ddd', 'eee', 'zzz'] # order of list item doesn't matter
Run Code Online (Sandbox Code Playgroud) 我有四个字符串的列表。然后在Pandas数据框中,我想创建一个变量,从该列表中随机选择一个值,并将其分配给每一行。我使用的是numpy的随机选择,但阅读他们的文档,没有种子选项。如何为随机分配指定随机种子,以便每次随机分配都相同?
service_code_options = ['899.59O', '12.42R', '13.59P', '204.68L']
df['SERVICE_CODE'] = [np.random.choice(service_code_options ) for i in df.index]
Run Code Online (Sandbox Code Playgroud) 我来自PyCharm,从VSCode开始,当我在VSCode中的输出窗口打印很多内容时,输出窗口会停留在最后执行内容的输出,我需要一直向下滚动才能看到新输出内容的最后一部分。
有没有办法设置让输出窗口自动转到输出内容的底部?我用谷歌搜索并搜索了 stackoverflow,但没有任何运气。
这是一些视觉效果来展示我的意思
我需要手动向下滚动才能看到最后的内容
python-2.7 ×6
pandas ×3
python-3.x ×3
python ×2
aggregation ×1
android ×1
arcpy ×1
dataframe ×1
gis ×1
hashtag ×1
kivy ×1
list ×1
matplotlib ×1
nltk ×1
numpy ×1
random ×1
regex ×1
scroll ×1
scrollview ×1
string ×1
text ×1
tweepy ×1
twitter ×1