小编man*_*ndy的帖子

ipython %timeit“赋值前引用的局部变量‘a’”

我正在尝试运行以下代码,但我得到了local variable 'a' referenced before assignment.

a = [x for x in range(10)]
b = [x for x in range(10)]
%timeit a+=b
Run Code Online (Sandbox Code Playgroud)

该声明无需%timeit魔法即可发挥作用。

我有什么遗漏的吗?

谢谢。

python ipython timeit

6
推荐指数
1
解决办法
2720
查看次数

在Python中创建自定义Spark RDD

是否可以在Python中扩展Spark的RDD以添加自定义运算符?如果不可能,如何为扩展RDD的类包装Scala代码,例如这里的那个:http: //blog.madhukaraphatak.com/extending-spark-api/

编辑:我正在尝试创建一个新的RDD,比如PersonRDD并在PersonRDD上添加一组新的运算符,例如.PersonRDD.computeMedianIncome().根据下面的链接,在Python中执行此操作并非易事.但是,由于它是一个旧线程,我想知道是否有任何新的更新.如果没有,我想使用Scala来做,但我不知道如何使用Py4J从Python调用该类(mail-archives.us.apache.org/mod_mbox/spark-user/201308.mbox/...)

任何建议或帮助将不胜感激.

曼迪

python apache-spark rdd pyspark

5
推荐指数
1
解决办法
2754
查看次数

是否可以从ndarray获取非连续的切片?

是否可以ndarray使用Vec而不是Slice对象来索引Rust 矩阵中的列?我能找到的唯一文档适用于使用连续列进行切片

具体来说,我试图在Python中实现类似下面的代码:

x = np.array([[1,2,3,4,5,6], [7,8,9,10,11,12]])
idx = [0,1,2,4]
x[:, idx]
Run Code Online (Sandbox Code Playgroud)

结果x[:, idx]将是包含所有行的矩阵的子集,并且仅包含所描述的列idx,即[0,1,2,4].

我目前正在使用ndarray(如标题所示),但我无法找到一种在非连续切片上进行子集化的方法.举例来说,你可以传递ndarray,可以取Slice一个start,stopindex,但我不能找到一种方式来传递,可以不使用描述列的列表Slice对象.

例如:

#[macro_use]
extern crate ndarray;

fn main() {
    let mut x = array![[1, 2, 3, 4, 5, 6], [7, 8, 9, 10, 11, 12]];
    let idx = vec![0, 1, 2, 4];
    // The following works as expected …
Run Code Online (Sandbox Code Playgroud)

indexing matrix rust

4
推荐指数
1
解决办法
180
查看次数

标签 统计

python ×2

apache-spark ×1

indexing ×1

ipython ×1

matrix ×1

pyspark ×1

rdd ×1

rust ×1

timeit ×1