小编Tho*_*son的帖子

是否可以从 Python 对 Mongo 进行非阻塞批量插入？

我必须读取来自网络的一些数据，然后将其插入到 MongoDB 中。所有这些都是使用 Python 脚本完成的。有什么方法可以从 Python 对 Mongo 进行非阻塞插入，这样我就可以在 Mongo 服务器处理插入的同时继续处理来自网络的数据？

python nonblocking blocking mongodb

Tho*_*son

lucky-day

5
推荐指数

1
解决办法

2008
查看次数

Python：将常量的值转换为常量的名称

如果我有一堂这样的课：

class MyClass:
    ONE = 1
    TWO = 2

Run Code Online (Sandbox Code Playgroud)

有没有办法使用反射或其他 Python 功能来简化下面的代码？

def class_value_to_string(my_class_num):
    if my_class_num == MyClass.ONE:
        return "ONE"
    elif my_class_num == MyClass.TWO:
        return "TWO"
    else:
        return "UNKNOWN VALUE"

Run Code Online (Sandbox Code Playgroud)

python reflection

Tho*_*son

lucky-day

5
推荐指数

1
解决办法

3764
查看次数

从 GNU 并行调用 GNU 并行

嵌套调用的正确方法是GNU parallel什么？

愚蠢的例子：

seq 1 100 | parallel echo {} | parallel seq {} 1000

Run Code Online (Sandbox Code Playgroud)

我的理解是，在 8 个 CPU 的机器上，每个并行将启动 8 个作业，总共 64 个作业。如果您调用的内容比seq这更重要，则可能会使盒子过载。有没有办法限制作业数量但仍然充分利用并行性？

shell gnu-parallel

Tho*_*son

2014 05-02

5
推荐指数

1
解决办法

253
查看次数

你怎么知道公共 Docker 镜像是安全的？

我刚刚开始使用 Docker，我看到docker hub 存储库中有很多可用的图像。似乎设置新 docker 容器的正常方法是复制这些图像之一并从那里开始。但是我怎么知道这些容器中没有恶意代码，或者它们不会以其他方式危害我的安全？

例如，但是我怎么知道容器中的操作系统没有（例如）在我通过 ssh 进入它时捕获击键，或者为了其他目的劫持系统资源？

security docker

Tho*_*son

lucky-day

5
推荐指数

1
解决办法

756
查看次数

为整个程序启用Cython性能分析？

Cython文档说"Cython中的分析是由编译器指令控制的.它可以通过Cython装饰器为整个文件或每个函数设置."

有没有简单的方法为整个Python程序启用Cython分析？也就是说,# cython: profile=True每次我想要打开和关闭分析时,有没有办法让我不必经历并添加几十个文件？

python profiling cython

Tho*_*son

lucky-day

5
推荐指数

1
解决办法

560
查看次数

如何将自纪元以来的秒数转换为Java中的小时/分钟/秒？

是否有快速,低垃圾的方式来做到这一点？我不能只做简单的模数运算,因为它不考虑闰秒和其他日期/时间有趣的业务.

java performance datetime

Tho*_*son

lucky-day

4
推荐指数

1
解决办法

6780
查看次数

下采样大熊猫的不规则时间序列

我在熊猫中有一个时间序列,如下所示:


2012-01-01 00:00:00.250000    12
2012-01-01 00:00:00.257000    34
2012-01-01 00:00:00.258000    45
2012-01-01 00:00:01.350000    56
2012-01-01 00:00:02.300000    78
2012-01-01 00:00:03.200000    89
2012-01-01 00:00:03.500000    90
2012-01-01 00:00:04.200000    12

有没有办法将其下采样到1秒数据而不对齐1秒边界？例如,有没有办法将这些数据输出(假设下采样的方式是使用在采样时间之前或采样时间发生的最新值):


2012-01-01 00:00:00.250000    12
2012-01-01 00:00:01.250000    45
2012-01-01 00:00:02.250000    56
2012-01-01 00:00:03.250000    89
2012-01-01 00:00:04.250000    12

python pandas

Tho*_*son

lucky-day

4
推荐指数

1
解决办法

2219
查看次数

如何在sklearn中重新拟合最佳分类器

使用 scikit-learn，我使用网格搜索来拟合分类器，如下所示：

from sklearn.svm import SVC
param_grid = { 
    'C': [1e-2, 0.1, 1.0],
    'gamma': [1e-4, 1e-3, 1e-2],
    'class_weight': ['auto']
}

clf = SVC()
gs = grid_search.GridSearchCV(clf, param_grid, cv=3, n_jobs=12)
gs.fit(x_train, y_train)

Run Code Online (Sandbox Code Playgroud)

我现在想使用找到的最佳参数和额外的参数重新训练分类器probability=True。如何使用最佳参数以及额外参数重新拟合分类器probability？

python scikit-learn

Tho*_*son

lucky-day

4
推荐指数

1
解决办法

3295
查看次数

为什么np.percentile返回高百分位数的NaN？

这段代码：

print len(my_series)
print np.percentile(my_series, 98)
print np.percentile(my_series, 99)

Run Code Online (Sandbox Code Playgroud)

给出：

14221  # This is the series length
1644.2  # 98th percentile
nan  # 99th percentile?

Run Code Online (Sandbox Code Playgroud)

为什么98可以正常工作而99可以正常工作nan？

python numpy pandas

Tho*_*son

lucky-day

4
推荐指数

1
解决办法

2363
查看次数

我怎样才能拒绝破坏构建的mercurial签到？

我有一个使用Mercurial管理的Java项目,并使用Jenkins构建.有没有办法阻止开发人员检查破坏构建的代码？我知道我可以用Ant和Mercurial钩子做到这一点,但有没有办法用Jenkins做到这一点？

java mercurial continuous-integration mercurial-hook jenkins

Tho*_*son

lucky-day

3
推荐指数

2
解决办法

528
查看次数

标签统计

python ×6

java ×2

pandas ×2

blocking ×1

continuous-integration ×1

cython ×1

datetime ×1

docker ×1

gnu-parallel ×1

jenkins ×1

mercurial ×1

mercurial-hook ×1

mongodb ×1

nonblocking ×1

numpy ×1

performance ×1

profiling ×1

reflection ×1

scikit-learn ×1

security ×1

shell ×1

标签 统计

小编Tho_son的帖子

标签统计