在尝试使用NLTK词性标记时,我注意到VBP在调用的输出中有很多标记nltk.pos_tag.我注意到这个标签不在Brown Corpus的语音标签集中.但它是UPenn标记集的一部分.
nltk默认使用什么标签?我在官方文档或apidocs中找不到这个.
这可能是我从文档中做出推断(给出了它的组织方式,并不难做到),但Facebook是否对应用程序开发人员如何创建和利用测试用户做了一些重大改变?
对于我的回忆(我上次在一个月前做过这个),开发人员过去能够从登录帐户中转到一个URL,将该用户转换为"测试用户",该用户在公众中没有任何权限系统,但可以作为发布,获取权限等的测试实体.我通过这种方法设置了测试用户,并为他/她生成了保存到数据库的访问令牌.
最近这一切都停止了.我的第一个问题是打印出我创建的Facebook对象的属性,一旦有了JSON解码的用户数据,现在有一个来自访问/ me/api端点的CURL进程的例外.
Facebook GraphAPI - 未捕获的EntCannotSeeExistenceException:当前查看器12345无法看到由id 12345支持的实体(类EntTestUser)(EntID:12345)
价值观明显改变,以保护无辜者.但是,用户ID是相同的,这使得由于某种原因拥有ID 12345的用户无权查看12345而感到奇怪
我查看了Facebook文档,发现他们的新逻辑似乎是让应用程序本身创建临时测试用户并为他们生成登录URL,这里有很多人可能熟悉的东西.
http://developers.facebook.com/blog/post/429
这个系统取代旧系统吗?似乎不再允许代表通过旧方法生成的测试用户帐户行事,因为它们不是由"应用程序"制作的.我写了一些快速逻辑来测试这个具有固定访问令牌的新流程并且它有效 - 我还应该提到所有应用程序逻辑功能,因为它最初没有真正用户帐户的错误.有没有其他人用他们的Facebook api应用程序体验过这个?我们可以肯定地说,通过这种旧方法制作的这些旧的访问令牌/用户ID /帐户现在实际上是无用的吗?
谢谢你.
有没有一种方法可以使用argparse挂钩的模块作为继承自接口的每个提示的解释器cmd?
我想让我的cmd接口以一种典型line的方式来解释典型的参数,就像解释运行时在bash shell上传递的选项和参数一样,使用可选参数和-位置参数。
我碰巧在Python中构建二进制搜索,但问题一般与二进制搜索结构有关.
让我们假设我有大约一千名符合条件的候选人,我正在使用二分搜索进行搜索,执行将分类数据集二等分的经典方法,并重复此过程以缩小符合条件的集合以进行迭代.候选人只是名字串,(第一种格式,例如"彼得杰克逊")我最初按字母顺序对集合进行排序,然后使用以下内容进行二分:
hi = len(names)
lo = 0
while lo < hi:
mid = (lo+hi)//2
midval = names[mid].lower()
if midval < query.lower():
lo = mid+1
elif midval > query.lower():
hi=mid
else:
return midval
return None
Run Code Online (Sandbox Code Playgroud)
此代码改编自此处:https://stackoverflow.com/a/212413/215608
这就是事情,上面的过程假设一个完全匹配或根本没有结果.如果查询仅仅是为了"彼得",但是有几个不同姓氏的彼此怎么办?为了归还所有彼得斯,人们必须确保二等分的"箱子"从未如此小到符合条件的结果.二分过程必须停止并放弃像正则表达式/常规旧字符串匹配才能返回所有Peters.
我不是在问这个如何实现这一点,因为这种类型的搜索被称为什么...什么是二进制搜索,带有"bin size"的分隔标准?有条件地将数据集一分为二的东西,一旦满足条件,就会回退到其他形式的字符串匹配,以确保查询上可以有效地存在结束通配符(因此搜索"Peter"将获得" Peter Jacksons"和"Peter Edwards")
希望我清楚我的意思.我意识到在典型的DB场景中,名称可能是分开的,这只是作为概念证明.
我正在利用pandas创建一个如下所示的数据框:
ratings = pandas.DataFrame({
'article_a':[1,1,0,0],
'article_b':[1,0,0,0],
'article_c':[1,0,0,0],
'article_d':[0,0,0,1],
'article_e':[0,0,0,1]
},index=['Alice','Bob','Carol','Dave'])
Run Code Online (Sandbox Code Playgroud)
我想从这个输入计算另一个矩阵,它将每行与所有其他行进行比较.让我们假设,例如计算是要找到交集的长度的功能,我想与输出数据框len(intersection(Alice,Bob)),len(intersection(Alice,Carol)),len(intersection(Alice,Dave))第一行,每行之后对别人该格式英寸 使用此示例输入,输出矩阵将是4x3:
len(intersection(Alice,Bob)),len(intersection(Alice,Carol)),len(intersection(Alice,Dave))
len(intersection(Bob,Alice)),len(intersection(Bob,Carol)),len(intersection(Bob,Dave))
len(intersection(Carol,Alice)),len(intersection(Carol,Bob)),len(intersection(Carol,Dave))
len(intersection(Dave,Alice)),len(intersection(Dave,Bob)),len(intersection(Dave,Carol))
Run Code Online (Sandbox Code Playgroud)
在pandas中有这种基于函数的计算的命名方法吗?实现这一目标的最有效方法是什么?
我正在使用 d3 来填充一个笛卡尔平面,其中svg:image包含分布在不同坐标上的一堆元素。
我想补充mouserover和mouseout该放大图像鼠标悬停在和减轻其他人的不透明度逻辑。我在鼠标悬停时过滤我的选择,只选择所需的元素,一切都很好,除了我的缩放逻辑似乎没有得到预期的效果。图像向下和向右扩展,而不是从对角中心向外扩展。
这是我尝试过的:
transform: scale(1.5) 扩大,但也完全改变了图像的位置transform: translate(-(width/2), -(height/2)) 与 scale 相结合,它的作用相同,但起始位置不同text-anchor我可以设置一个“锚点”来缩放的图像元素是否没有等价物?我不确定 html svg 的说法是什么,但我想我在想一些类似于许多矢量编辑器的锚点的东西。
当前方法,鼠标悬停处理程序:
function fade(dir){
return function(d){
var others = svg.selectAll("image.movie_cover")
.filter(function(g,i){
return g != d
})
.transition().duration(800)
.style("opacity",.3);
var single = svg.selectAll("image.movie_cover")
.filter(function(g,i){
return g === d;
})
.transition().duration(900)
.attr("transform", "translate(-40,-40) scale(1.4)")
var title = keys[coords.indexOf(d)];
var url = "/static/eshk/"+hash+"_images/" + title + ".jpg";
tt.transition()
.duration(200)
.style("opacity", .9);
tt.html(title)
.style("left", (d3.event.pageX) …Run Code Online (Sandbox Code Playgroud) 在完成Toby Segaran撰写的精彩的"编程集体智慧"一书时,我遇到了一些我并不完全熟悉的索引分配技巧.
以此为例:
createkey='_'.join(sorted([str(wi) for wi in wordids]))
Run Code Online (Sandbox Code Playgroud)
要么:
normalizedscores = dict([(u,float(l)/maxscore) for (u,l) in linkscores.items()])
Run Code Online (Sandbox Code Playgroud)
索引中的所有嵌套元组让我有点困惑.实际上分配给这些变量的是什么?我假设显然是.join一个字符串,但后者怎么样?如果有人能够解释这些循环的机制,我真的很感激.我认为这些是非常常见的技术,但对Python来说是新手,我想要问的是片刻的耻辱.谢谢!
我想知道在PHP中是否有某种方法可以复制Python属性/密钥访问的一些魔力.
我使用由Steve Lacey编写的名为Minimongo的Mongo ORM类,其中他利用__getattr__和__getitem__重新路由关键和属性风格的访问并保留Mongo的"文档导向"特性. val = doc.foo并val = doc['foo']变得相同.
我想知道PHP中是否存在类似的接口,允许更改从其继承的类处理对象访问的方式.我仔细查看了STL,找不到一个装满西装的人.这对于设置默认值非常有用.谢谢.
我有一个带有以下目录结构的烧瓶应用程序:
__init__.py__init__.py模型使用Flask-SQLAlchemy,因此,他们需要访问db对象(SQLAlchemy实例)application.py
user.py:
import sys,os
sys.path.append('/path/to/application/package')
from testapp import db
class User(db.Model):
id = db.Column(db.Integer,primary_key=True)
username = db.Column(db.String(255),unique=True)
age = db.Column(db.Integer)
def __init__(self,username,age):
self.username = username
self.age = age
def __repr__(self):
return '<User %r>' % self.username
Run Code Online (Sandbox Code Playgroud)
因为任何模型都需要访问应用程序的SQLAlchemy实例,该db属性,我必须将整个包放在路径上,然后从主应用程序模块导入.为了理智,我想将模型保存在单独的文件中.我是否需要将路径代码放在每个模型的顶部?有没有更好的办法?我宁愿没有这样的完整路径输入,因为它们可能被部署到具有不同目录结构的不同主机.理想情况下,会有一些内部处理路径的方法,所以当它被用作另一个用户时,mod_wsgi我不必手动更改代码.
我想知道在python 2.7中观察到的行为的实际原因是什么:
import hashlib
hashlib.md5('foo') == hashlib.md5('foo')
Run Code Online (Sandbox Code Playgroud)
返回false.但...
import hashlib
hashlib.md5('foo').hexdigest() == hashlib.md5('foo').hexdigest()
Run Code Online (Sandbox Code Playgroud)
返回true.我知道hexdigest/digest返回最后的字符串表示,但由于直接将相同的数据输入到两个哈希对象中,它们不应该评估为彼此相等吗?md5 HASH当__eq__调用魔法时,对象是否不会意识到内部身份?对象本身会以什么理由评估不平等?真的很好奇.