小编900*_*000的帖子

python 脚本的源输出因管道异常而失败

我试图让 python 脚本的输出可获取。即我希望能够运行:

$ source <(python example.py)
Run Code Online (Sandbox Code Playgroud)

它总是因同样的问题而失败:

Exception ignored in: <_io.TextIOWrapper name='<stdout>' mode='w' encoding='UTF-8'>
BrokenPipeError: [Errno 32] Broken pipe
Run Code Online (Sandbox Code Playgroud)

这是示例.py:

print("export ENV_VAR=abc")
Run Code Online (Sandbox Code Playgroud)

有没有办法解决?我试图尝试捕获异常(BrokenPipeError),但它似乎不起作用。该异常似乎阻止了采购工作,因为

$ echo $ENV_VAR
Run Code Online (Sandbox Code Playgroud)

给我什么也没有

python macos bash python-3.x

5
推荐指数
1
解决办法
370
查看次数

如何在Python中下载zip文件并从中解析csv文件

我编写了一个脚本,它会点击 URL 并下载 zip 文件,然后解压缩。现在我在解析解压后得到的 CSV 文件时遇到问题。

import csv
from requests import get
from io import BytesIO
from zipfile import ZipFile

request = get('https://example.com/some_file.zip')
zip_file = ZipFile(BytesIO(request.content))
files = zip_file.namelist()
with open(files[0], 'r') as csvfile:
    csvreader = csv.reader(csvfile)
    for row in csvreader:
        print(row)
Run Code Online (Sandbox Code Playgroud)

python python-3.x

5
推荐指数
2
解决办法
4308
查看次数

Wordnet(Word Sense Annotated)语料库

我一直在使用许多不同的语料库进行自然语言处理,我一直在寻找一个用Wordnet Word Senses注释的语料库.

据我所知,这些信息可能没有大的语料库,因为语料库需要手动构建,但必须有一些东西可以解决.

此外,如果不存在语料库,是否至少存在一个带注释的ngram数据库(每个词的定义的百分比,或每个wordnet定义的数字计数,取决于词义的常见程度)是)?

nlp corpus wordnet tagged-corpus

4
推荐指数
1
解决办法
1598
查看次数

ArrayList <Double> to double [],有3亿条目

我正在使用java程序从数据库中获取一些数据.然后我计算一些数字并开始将它们存储在一个数组中.我正在使用的机器有4台RAM.现在,我不知道预先会有多少数字,所以我使用了ArrayList<Double>.但是我知道会有大致的数字300 million numbers.

因此,由于一个double是8个字节,因此该数组将消耗的内存的粗略估计是2.4 gigs(可能更多是因为ArrayList的开销).在此之后,我想计算这个数组的中位数,并使用org.apache.commons.math3.stat.descriptive.rank.Median作为double[]数组输入的库.所以,我需要转换ArrayList<Double>double[].

我确实看到了很多问题,并且他们都提到没有办法绕过整个阵列.现在这很好,但由于它们也将两个对象都保存在内存中,这使我的内存需求高达4.8演出.现在我们遇到了一个问题,因为总RAM可用我们4演出.

首先,我怀疑该程序在某些时候会给我一个正确的内存错误(它当前正在运行)?如果是这样,我如何计算中位数而不必分配双倍内存?我想避免排序数组,因为计算中位数是O(n).

java memory median

4
推荐指数
1
解决办法
1375
查看次数

Django和缓慢的迁移:如何快速获得一个空的数据库?

我有一个Django 1.8代码库,有14个应用程序和~90个表.大多数应用都有1-2次迁移.

我注意到,运行测试套件所花费的大部分时间都用于应用迁移.将所有迁移应用于空数据库可能需要> 5分钟.

但是,创建数据库并将SQL转储导入其中需要1-2秒才能实现相同的数据库状态.

我们没有使用标准manage.py test方法,因此使用--keepdb可能适合我.(即便如此,每次运行至少需要支付一次迁移费用.)

我正在寻找的是根据最新模型定义创建空数据库的方法.例如,进行初始迁移就好像所有其他迁移都不存在一样会产生正确的效果.

有没有一种已知的方法来实现这一目标?或者,在测试期间需要很长时间才能解决迁移问题的另一种众所周知的方法吗?

python mysql testing django database-migration

4
推荐指数
1
解决办法
2167
查看次数

Ceph radosgw - 存储桶策略 - 默认将所有对象设为公开读取

我与一群非开发人员一起工作,他们通过 radosgw 将对象上传到 s3 风格的存储桶。所有上传的对象都需要公开可用,但它们不能以编程方式执行此操作。有没有办法让对象的默认权限公开读取,这样就不必每次都手动设置?必须有一种方法来做到这一点boto,但我还没有找到任何例子。使用 AWS 的 GUI 有一些浮动,但这对我来说不是一个选择。:(

我正在创建一个这样的桶:

#!/usr/bin/env python

import boto
import boto.s3.connection

access_key = "SAMPLE3N84XBEHSAMPLE"
secret_key = "SAMPLEc4F3kfvVqHjMAnsALY8BCQFwTkI3SAMPLE"

conn = boto.connect_s3(
        aws_access_key_id = access_key,
        aws_secret_access_key = secret_key,
        host = '10.1.1.10',
        is_secure=False,
        calling_format = boto.s3.connection.OrdinaryCallingFormat(),
        )

bucket = conn.create_bucket('public-bucket', policy='public-read')
Run Code Online (Sandbox Code Playgroud)

我将策略设置为 public-read 这似乎允许人们将存储桶作为目录浏览,但存储桶中的对象不继承此权限。

>>> print bucket.get_acl()
<Policy: http://acs.amazonaws.com/groups/global/AllUsers = READ, S3 Newbie (owner) = FULL_CONTROL>
Run Code Online (Sandbox Code Playgroud)

澄清一下,我知道我可以像这样在每个对象的基础上解决这个问题:

key = bucket.new_key('thefile.tgz')
key.set_contents_from_filename('/home/s3newbie/thefile.tgz')
key.set_canned_acl('public-read')
Run Code Online (Sandbox Code Playgroud)

但是我的最终用户无法执行此操作,因此我需要一种方法将其设置为上传文件的默认权限。

python amazon-s3 boto ceph radosgw

4
推荐指数
1
解决办法
2745
查看次数

PostgreSQL:使用tabB和tabC中的选项更新tabA

我在tabC中有一个选择.我已将该选择应用于tabB.现在我要用这两个选项中的值更新tabA.

在tabC和tabB上选择:

SELECT * FROM tabC
WHERE id_field IN
  (SELECT id_field FROM tabB WHERE date_IN = '2011-02-22')
ORDER BY id_field
Run Code Online (Sandbox Code Playgroud)

更新标签:

UPDATE tabA
SET field_1 = tabC.field_1, field_2 = tabC.field_2, field_2 = tabC.field_2
FROM tabC WHERE tabA.id_field IN
  (SELECT tabC.id_field FROM tabC WHERE tabC.id_field IN
    (SELECT id_field FROM tabB WHERE date_IN = '2011-02-22'))
Run Code Online (Sandbox Code Playgroud)

UPDATE语句运行没有任何错误,但结果不是我想要的:3个字段对所有行都有相同的值.怎么了?

postgresql select

3
推荐指数
1
解决办法
5666
查看次数

matlab中的函数

这看起来很简单.我想定义一个函数:

syms x

f = x^2

我希望能够做到f(4)并吐出16.我还想避免写一个新的m文件.

matlab

2
推荐指数
1
解决办法
73
查看次数

如何在属性get()方法中访问字段值

我可以在Kotlin get()方法中访问属性的值吗?

考虑以下:

class MyTest {

    var test: String = "string"
        get() {
            logIt("Property accessed")
            return it
        }

}
Run Code Online (Sandbox Code Playgroud)

魔术变量it不存在.我该如何获得实际房产价值?

kotlin

2
推荐指数
1
解决办法
313
查看次数

列表理解列表中的元组列表

是否有哈斯克尔这有助于我把一个元组的列表,例如任何函数或方法[(1,2),(3,4),(5,6)],并
返回[1,2,3,4,5,6]与列表理解的作品?

我专门搜索一个函数,它接受一个参数xs并且
在函数体(函数体)中有一个列表理解.

haskell list-comprehension list

1
推荐指数
1
解决办法
388
查看次数

获取由多个值组成的单个列

如何在MySQL中用逗号分隔一列项目?

如果我这样做,select * from (select 1, 2, 3, 4, 5) a;它会给我5个不同的列,而不是一个名为的列(1, 2, 3, 4, 5).谁能帮我吗?

mysql

0
推荐指数
1
解决办法
60
查看次数

越来越多的原始数组在java中

我正在学习Android,同时提高我的效率知识.我正在编写一个密码生成器,它使用特定规则从一组字符生成随机密码.我有一个数组,我打算存储字符.数组的大小为X,这是所有情况下可能的字符数.然后,我向阵列添加最多三组附加字符.由于我无法调整数组的大小,因此每次使用复制循环或ArrayCopy或类似工具时,我都必须复制并重新创建它.

我应该这样做还是切换到例如ArrayList?当然,在现实生活中也不会出现问题,因为总共会有大约70个字符,但我对此感兴趣.

谢谢大家.

伪代码:

initialize array  
add first set  
if adding second set  
    add second set  
if adding third set  
    add third set  
if adding fourth set  
    add fourth set  
return array
Run Code Online (Sandbox Code Playgroud)

java arrays

0
推荐指数
1
解决办法
336
查看次数