小编Par*_*and的帖子

从字典创建NumPy数组的最佳方法?

我刚刚开始使用NumPy,所以我可能会错过一些核心概念......

从值为列表的字典创建NumPy数组的最佳方法是什么?

像这样的东西:

d = { 1: [10,20,30] , 2: [50,60], 3: [100,200,300,400,500] }
Run Code Online (Sandbox Code Playgroud)

应该变成这样的东西:

data = [
  [10,20,30,?,?],
  [50,60,?,?,?],
  [100,200,300,400,500]
]
Run Code Online (Sandbox Code Playgroud)

我将对每一行做一些基本的统计,例如:

deviations = numpy.std(data, axis=1)
Run Code Online (Sandbox Code Playgroud)

问题:

  • 从字典中创建numpy.array的最佳/最有效方法是什么?字典很大; 几百万把钥匙,每件钥匙约有20件.

  • 每个'行'的值的数量是不同的.如果我理解正确numpy想要统一大小,那么我为缺少的项目填写什么让std()开心?

更新:有一件事我忘了提及 - 虽然python技术是合理的(例如,循环几百万个项目很快),但它仅限于一个CPU.Numpy操作可以很好地扩展到硬件并击中所有CPU,因此它们很有吸引力.

python numpy

8
推荐指数
1
解决办法
1万
查看次数

服务器< - >设备的数据同步框架/算法?

我正在寻求在服务器和分布式客户端之间实现数据同步.服务器上的数据源是mysql,顶部是django.客户可以有所不同.更新可以在客户端或服务器上进行,并且服务器和客户端之间的连接不可靠(例如,可以在断开连接的手机上进行更改,当手机再次连接时应该同步).

S. Lott建议在这个问题中使用版本控制设计模式,这是有道理的.我想知道是否有任何现有的包/实现我可以使用.或者,我应该直接使用svn/git/etc吗?

还有其他选择吗?必须有同步框架或算法的详细描述,但我找不到很多运气.如果你指出我正确的方向,我将不胜感激.

python django synchronization

8
推荐指数
1
解决办法
4939
查看次数

使用Python的SSO的SPNEGO(kerberos令牌生成/验证)

我正在尝试实现一个简单的单点登录方案,其中一些参与的服务器将是Windows(IIS)框.看起来SPNEGO是一条合理的道路.

这是场景:

  • 用户使用他的用户名和密码登录我的SSO服务.我使用某种机制来验证他.
  • 稍后用户想要访问App A.
    • 用户对App A的请求被SSO服务拦截.SSO服务使用SPNEGO将用户登录到App A:
      • SSO服务点击App A网页,获得"WWW-Authenticate:Negotiate"响应
      • SSO服务代表用户生成"授权:协商xxx"响应,响应App A.用户现在登录到App A.
    • SSO服务拦截后续用户对App A的请求,在将Authorization头传递给App A之前将其插入其中.

听起来不错吗?

我需要两件事(至少我现在能想到的):

  • 能够代表用户生成"授权:协商xxx"令牌,最好使用Python
  • 在Python中验证"授权:协商xxx"标头的能力(对于项目的后续部分)

python kerberos active-directory spnego single-sign-on

8
推荐指数
1
解决办法
9848
查看次数

安全,可沙箱的用户暴露的编程语言/环境?

除了为我的网站提供API之外,我还想让用户能够编写可在我的服务器上运行的简单脚本.这些脚本可以访问用户拥有的对象,并能够操作,修改和处理其数据.

我希望能够将这些脚本所占用的资源限制在一个很好的水平(例如,最大执行时间应该是100毫秒).我还想确保一个安全的沙箱,这样每个用户只能访问一组有限的数据和资源,并且无法访问磁盘,其他人的数据等.

通常,脚本将非常简单(例如,创建匹配特定条件的值的总和或平均值),并且它们通常将在模板中使用(例如,用平均值填充此单元格或html元素的值或和).

理想情况下,我想使用一个众所周知的常用编程语言的沙盒子集,以便用户轻松获取.后端是用Python编写的,因此基于Python的语言可以带来好处,但我对其他语言和技术持开放态度.由于其简单的特性和通用可用性,Javascript也很有吸引力.

这些语言应该支持创建DSL和库.

目标受众是基于Web的应用程序的一般用户群,不一定非常技术性.换句话说,它不是针对具有任何特定编程语言的特定知识的基础.我的期望是用户的一部分将创建将由大多数人使用的脚本.

有关语言和技术的任何想法或建议吗?其他人试图这样做的例子以及他们遇到的成功和失败?

javascript python sandbox

7
推荐指数
1
解决办法
388
查看次数

Python:电子邮件get_payload解码在达到等号时失败了吗?

使用get_payload遇到奇怪的事情:当它在解码的消息中看到一个等号时,它似乎很糟糕.这是显示错误的代码:

import email

data = file('testmessage.txt').read()
msg  = email.message_from_string( data )
payload = msg.get_payload(decode=True)
print payload
Run Code Online (Sandbox Code Playgroud)

这是一个示例消息:测试消息.

消息仅打印到第一个"=".其余部分省略.谁知道发生了什么事?

带有"decode = False"的相同脚本会返回完整的消息,因此看起来解码对等号不满意.

这是在Python 2.5下.

python email

7
推荐指数
1
解决办法
4889
查看次数

Django-mptt完全越野车或我做错了吗?

我试图用很少的运气来使用django-mptt.这是与Python2.5,windows,sqlite3,Django 1.2pre,django-mptt最新的svn.

代码:

模型:

class Node(models.Model):
    name   = models.CharField(max_length=20, blank=True)
    parent = models.ForeignKey('self', null=True, blank=True, related_name='children')

    def __unicode__(self):
        return self.name

mptt.register(Node)
Run Code Online (Sandbox Code Playgroud)

建立:

nodes = []
for i in range(15):
    n = Node(name='node'+str(i))
    n.save()
    nodes.append(n)

nodes[0].move_to(None)
nodes[0].save()
for n in range(1,15):
    nodes[n].move_to(nodes[(n-1)/2],'last-child')
    nodes[n].save()
Run Code Online (Sandbox Code Playgroud)

这应该创建一个树,其中一个根和两个子节点挂在每个非叶节点之外.

现在好玩的开始了:

>>> nodes[0].children.all()
[<Node: node1>, <Node: node2>]
>>> nodes[0].get_descendants()
[]

>>> nodes[0].get_descendants(True)
[<Node: node0>, <Node: node2>]


>>> for n in nodes:
...     print n, n.get_ancestors()
...
node0 []
node1 [<Node: node0>]
node2 [<Node: node0>]
node3 …
Run Code Online (Sandbox Code Playgroud)

django mptt django-mptt

7
推荐指数
1
解决办法
2407
查看次数

极简主义,微小的Javascript模板系统?

我正在寻找一个简约的javascript模板系统,ala John Resig的Javascript Micro Templating.越小越好,如果它的jquery更好.建议?

我试过John的微模板,但遇到了一些问题,想看看是否有更多烘焙/更好的包装解决方案.

[更新]我再次尝试了Resig的Micro Templating,它对我来说效果很好.如果有的话,仍然希望听到其他替代方案.

javascript jquery templates

7
推荐指数
2
解决办法
2536
查看次数

将域的电子邮件定向到AppEngine电子邮件接收服务?

我希望收到一个给定域名的电子邮件,比如http://mydomain.com/,由AppEngine应用程序处理,我们称之为http://emailprocessor.appspot.com/.

也就是说,应该通过emailprocessor.appspot.com接收并处理发送到"hello@mydomain.com"的电子邮件,就好像它是发送到"hello@emailprocessor.appspot.com"的电子邮件一样.

我想我可以通过MX记录为我的mydomain.com域做到这一点,但我无法在任何地方找到指令.

这是可能的,如果是这样的话,可以设置它吗?

email google-app-engine

7
推荐指数
1
解决办法
858
查看次数

JPEG内置校验和/指纹?

我正在整理一个脚本来查找大型图像库中的删除重复项.目前我正在做一个双通过滤器,首先找到相同大小的文件,然后在10240字节的文件上做一个sha256,以获得具有相同大小的文件的指纹(这里是代码).

它运行良好,但我猜我可能使用jpeg格式内置校验和,而不是使用sha256.

有谁知道是否有校验和或其他组件可以作为校验和/指纹?如果是这样,是否有一种有效的方式来访问它们?

jpeg checksum fingerprint

6
推荐指数
1
解决办法
4950
查看次数

EC2自动化工具/策略?

您使用哪些工具或策略来实现EC2活动的自动化?

我需要能够调出一些EC2实例,为它提供各种软件(主要是Python包),与S3交互(主要是下载数据),以及运行各种工作.我将按需和按计划进行此操作.

我正在努力决定是否应该:

  • 创建一个AMI,其上载有我的所有软件或
  • 启动一个简单的vanilla linux AMI实例并将我的软件scp到它

对于配置和自动化,Boto看起来相当不错.或者我可以和Paramiko一起写点东西.推荐我或者其他任何我应该看的东西?

基本上我正在寻找建议/成功案例,让我知道什么对你有用.

amazon-s3 amazon-ec2

6
推荐指数
1
解决办法
2326
查看次数