小编Abe*_*Abe的帖子

如何使用jquery检查两个属性是否具有相同的值？

我正在尝试编写一个jquery选择器,它将选择对其两个属性具有相同值的对象.

像这样的东西:

$('div[attr1=attr2]')

Run Code Online (Sandbox Code Playgroud)

鉴于:

<div attr1="foo" attr2="bar">A</div>
<div attr1="bar" attr2="bar">B</div>
<div attr1="foo" attr2="bar">C</div>
<div attr1="foo" attr2="foo">D</div>

Run Code Online (Sandbox Code Playgroud)

我希望它返回到B和D div的链接.

有什么想法吗？

jquery

Abe*_*Abe

lucky-day

4
推荐指数

2
解决办法

1205
查看次数

有没有一种方法可以在matplotlib中获取轴的get父画布？

我正在使用matplotlib围绕统计模型/模拟构建一个非常基本的GUI.我想添加这种类型的计时器,以允许一些动画.问题:我的对象设置方式,我可以轻松访问MPL轴对象,但不能访问画布.

有没有一种方法可以在matplotlib中获取轴的get父画布？似乎是解决此问题的最简单方法.

或者,是否有明显的解决方法？我对matplotlib很新.

python matplotlib

Abe*_*Abe

lucky-day

4
推荐指数

1
解决办法

3930
查看次数

从takeOrdered返回RDD,而不是列表

我正在使用pyspark进行一些数据清理.一个非常常见的操作是获取文件的小型子集并将其导出以供检查:

(self.spark_context.textFile(old_filepath+filename)
    .takeOrdered(100) 
    .saveAsTextFile(new_filepath+filename))

Run Code Online (Sandbox Code Playgroud)

我的问题是takeOrdered返回一个列表而不是RDD,所以saveAsTextFile不起作用.

AttributeError: 'list' object has no attribute 'saveAsTextFile'

Run Code Online (Sandbox Code Playgroud)

当然,我可以实现自己的文件编写器.或者我可以使用parallelize将列表转换回RDD.但我想在这里成为一个火花纯粹主义者.

有没有办法从takeOrdered或等效函数返回RDD？

python apache-spark rdd

Abe*_*Abe

lucky-day

4
推荐指数

1
解决办法

1400
查看次数

启动 jupyter-lab 并从命令行打开特定笔记本？

我正在编写一个 bash 脚本，它以启动 jupyter-lab 并（理想情况下）打开一个特定的笔记本结束。

在 jupyter 中，这很容易做到：

$ jupyter notebook my_folder/my_notebook.ipynb

我在 jupyter-lab 中找不到有关如何执行此操作的任何指导。想法？

jupyter-notebook jupyter-lab

Abe*_*Abe

lucky-day

3
推荐指数

1
解决办法

8200
查看次数

在python中,有没有办法自动替换缺失值？

我正在尝试解析一个由一组对象组成的JSON对象.每个对象包含多个字段,但通常缺少字段.这是一个例子:

{
    'objects' : [{
        'fieldA' : 1,
        'fieldB' : 2,
        'fieldC' : 3,
    },
    {
        'fieldA' : 7,
        'fieldC' : 8,
    },
    {},
    {
        'fieldB' : 1,
        'fieldC' : 0,
    }]
}

Run Code Online (Sandbox Code Playgroud)

我想将每个字段转换为一个列表,保留对象的顺序,相当于:

fieldA = [1,7,"Missing","Missing"]
fieldB = [2,"Missing","Missing",1]
fieldC = [3,8,"Missing",0]

Run Code Online (Sandbox Code Playgroud)

有一个简单的方法吗？我可以想出办法,包括很多'if'和'in'语句以及重复迭代列表.但似乎应该有更多的pythonic方式来做到这一点,例如:

fieldA = [ (obj.fieldA | "missing") for obj in json.objects]

Run Code Online (Sandbox Code Playgroud)

python语法是否允许这样的东西？

python list

Abe*_*Abe

lucky-day

2
推荐指数

1
解决办法

98
查看次数

python计数器列表列表？

我想通过调用collections.Counter来计算列表中项目的频率。诀窍是我的列表本身包含列表：

鉴于：

[[1,"a"], [2,"b"], [3,"c"], [1,"a"], [1,"a"]

Run Code Online (Sandbox Code Playgroud)

生产：

{
  ([1,"a"], 3),
  ([2,"b"], 1),
  ([3,"c"], 1)
}

Run Code Online (Sandbox Code Playgroud)

当我使用列表实例化Counter时，我得到 TypeError: unhashable type: 'list'.

柜台可以做我想要的吗？还有其他方法（合理有效）吗？

python list count

Abe*_*Abe

lucky-day

2
推荐指数

1
解决办法

1794
查看次数

如何将ndarray转换为scipy中的矩阵？

如何将ndarray转换为numpy中的矩阵？我正在尝试从csv导入数据并将其转换为矩阵.

from numpy import array, matrix, recfromcsv
my_vars = ['docid','coderid','answer1','answer2']
toy_data = matrix( array( recfromcsv('toy_data.csv', names=True)[my_vars] ) )
print toy_data
print toy_data.shape

Run Code Online (Sandbox Code Playgroud)

但我明白了:

[[(1, 1, 3, 3) (1, 2, 4, 1) (1, 3, 7, 2) (2, 1, 3, 3) (2, 2, 4, 4)
  (2, 4, 3, 1) (3, 1, 3, 3) (3, 2, 4, 3) (3, 3, 3, 4) (4, 4, 5, 1)
  (4, 5, 6, 2) (4, 2, 4, 3) (5, 2, 5, 4) (5, 3, 3, 1) (5, …

Run Code Online (Sandbox Code Playgroud)

python arrays numpy matrix

Abe*_*Abe

lucky-day

1
推荐指数

1
解决办法

3633
查看次数

给定对象之后的第一个对象的选择器

我正在尝试使用jquery来选择跟随已知对象的列表中的第一个对象.

我有一个这样的文件:

<div>A</div>
<div class="special">B</div>
<div>C</div>
<div>D</div>
<div>E</div>

Run Code Online (Sandbox Code Playgroud)

我之前运行过这个:

foo = $(".special");

Run Code Online (Sandbox Code Playgroud)

我想运行类似的东西:

$( foo+" + div" );

Run Code Online (Sandbox Code Playgroud)

要取回包含"C"的div.这一定很简单,但我无法弄清楚如何做到这一点.

(注意:我知道$(".special + div").问题是我需要将".special"存储为变量.)

jquery

Abe*_*Abe

lucky-day

1
推荐指数

1
解决办法

46
查看次数

如何重置和预先准备django中的所有用户？

我正在开发一个带有一些复杂用户交互的django应用程序,所以我需要做很多测试.是否有一种简单的方法可以清除数据库中的Users表(以及所有关联的表)以重新启动？另外,有一个很好的方法来自动填充数据库与"测试用户"玩耍？

细节:

这是我希望执行多次的操作,因此能够从命令行快速运行它会很好.
我在django 1.3.1中使用基本的用户模型(django.contrib.auth.models.User)
我没有使用管理页面,宁愿保持这种方式,除非事情变得非常绝望.

谢谢!

django reset django-users

Abe*_*Abe

lucky-day

1
推荐指数

1
解决办法

2603
查看次数

python pandas:在数据框中重命名一个系列？

我正在使用python pandas进行数据分析,我想在数据框中更改系列的名称.

这有效,但似乎非常低效:

AA = pandas.DataFrame( A )
for series in A:
    AA[A_prefix+series] = A[series]
    del A[series]

Run Code Online (Sandbox Code Playgroud)

有没有办法改变系列名称？

python dictionary series pandas

Abe*_*Abe

lucky-day

1
推荐指数

1
解决办法

4475
查看次数

numpy/pandas:如何将一系列0和1的字符串转换为矩阵

我有一个以这种格式到达的数据:

[
  (1, "000010101001010101011101010101110101", "aaa", ... ),
  (0, "111101010100101010101110101010111010", "bb", ... ),
  (0, "100010110100010101001010101011101010", "ccc", ... ),
  (1, "000010101001010101011101010101110101", "ddd", ... ),
  (1, "110100010101001010101011101010111101", "eeee", ... ),
  ...
]

Run Code Online (Sandbox Code Playgroud)

在元组格式中,它看起来像这样:

(Y, X, other_info, ... )

Run Code Online (Sandbox Code Playgroud)

在一天结束时,我需要使用Y和X训练分类器(例如sklearn.linear_model.logistic.LogisticRegression).

将1和0的字符串转换为np.array之类的最直接的方法是什么,以便我可以通过分类器运行它？好像这里应该有一个简单的答案,但我还没有想到/ google one.

几点说明:

我已经在使用numpy/pandas/sklearn,所以这些库中的任何东西都是合理的游戏.
对于我正在做的很多事情,在DataFrame中将other_info列放在一起很方便
字符串很长(约20,000列),但总数据帧不是很高(约500行).

python numpy pandas scikit-learn

Abe*_*Abe

lucky-day

1
推荐指数

1
解决办法

1478
查看次数

mrjob:在reducer输出中抑制键(或值)

默认情况下,mrJob以key [tab]输出格式存储密钥和输出值.

即使键(或值)为空,空或其他不感兴趣,也会发生这种情况.假设我的键,值对是None,{"a":1","b":1}.然后我得到这个:

None    {"a":1, "b":2}

Run Code Online (Sandbox Code Playgroud)

有没有办法压制关键或价值？我只想要这个:

{"a":1, "b":2}

Run Code Online (Sandbox Code Playgroud)

顺便说一下,我已经尝试过了.我错过了什么......？

class MyMrJobClass(MRJob):
    OUTPUT_PROTOCOL = mrjob.protocol.JSONProtocol

    def step1_mapper(self, _, line):
        ...
        yield my_key, my_value

    def step1_reducer(self, key, values):
        for v in values:
            ...
        yield None, my_data

    def steps(self):
        return [
            self.mr(
                mapper=self.step1_mapper,
                reducer=self.step1_reducer,
            ),
        ]

Run Code Online (Sandbox Code Playgroud)

注意:我知道我不需要覆盖单步工作的步骤.这最终将是一个多步骤的工作,因此以这种方式构建类非常重要.

谢谢!

mrjob

Abe*_*Abe

2013 04-26

1
推荐指数

1
解决办法

1306
查看次数