小编Shu*_*uan的帖子

如何从另一个ipython-notebook导入？

我想从另一个ipython-notebook导入一个func.说,

common_func.ipnb 具有 def func_a()

当我创建一个新笔记本时,如何func_a从另一个笔记本中访问哪个笔记本,但是在同一个文件夹和相同的ipython实例中？

谢谢!

ipython jupyter-notebook

Shu*_*uan

2019 04-11

43
推荐指数

4
解决办法

3万
查看次数

如何使用python以编程方式测量HTML源代码中元素的大小？

我在python中进行网页布局分析.基本任务是以给定HTML源代码的方式编程测量元素的大小,以便我们可以获得网页语料库的内容/广告比率,广告块位置,广告块大小的统计数据.

一种显而易见的方法是使用width/height属性,但它们并不总是可用.此外,width: 50%需要在加载到DOM后计算.所以我想将HTML源代码加载到一个窗口大小的预定义浏览器中(比如机械化虽然我不确定窗口的大小是否可以设置)是一种很好的尝试方法,但机械化不支持返回元素大小无论如何.

在python中有没有通用的方法(没有宽度/高度属性),最好是用一些库？

谢谢!

html python dom

Shu*_*uan

2013 03-28

7
推荐指数

1
解决办法

1439
查看次数

如何在scikit-learn DecisionTreeRegressor中使用实际的功能名称而不是"X"？

我想这是可能的,因为在fit函数的def中它说:

X:类似数组,shape = [n_samples,n_features]

我现在有,

在此输入图像描述

我当然可以生成决策树的字符串表示,然后X[]用实际的功能名称替换.但我想知道该fit函数是否可以直接将特征名称作为输入的一部分？我为每个样本尝试了以下格式

[1,2,"feature_1","feature_2"]
[[1,2],["feature_1","feature_2"]]

但都没有奏效.这是什么shape意思？你能举个例子吗？

python scikit-learn

Shu*_*uan

lucky-day

7
推荐指数

1
解决办法

8854
查看次数

如何在北京（中国）存储桶和全球存储桶之间同步 S3 中的数据？

北京（中国）地区非常独特，因为它几乎所有的东西都是独立的（与 AWS 全球分开）。例如，要使用 AWS CLI 列出我们必须指定的对象region和endpoint-url：

aws --region cn-north-1 \
  --endpoint-url https://s3.cn-north-1.amazonaws.com.cn \
  --profile AN_AWS_CN_PROFILE \
  s3 ls s3://AN_AWS_CN_BUCKET/

Run Code Online (Sandbox Code Playgroud)

我的问题是如何在北京（中国）存储桶和全球存储桶之间同步数据？首先，无法使用指定的region&识别全局存储桶endpoint-url。例如，

aws --region cn-north-1 \
  --endpoint-url https://s3.cn-north-1.amazonaws.com.cn \
  --profile AN_AWS_CN_PROFILE \
  s3 cp s3://AN_AWS_CN_BUCKET/ s3://AN_AWS_IRELAND_BUCKET/

Run Code Online (Sandbox Code Playgroud)

会给

致命错误：调用ListObjects操作时发生错误（NoSuchBucket）：指定的bucket不存在

（目标存储桶确实存在。）

到目前为止，我已经探索了 CLI 参数和.aws/config文件来定义配置文件。也许有可能使用多个profile在一个单一的命令，但它似乎并不可能配置endpoint-url的.aws/config，因为没有提到它在这里。

现在我只是将文件复制到本地然后上传，随着数据集的快速增长，这将成为一个问题。使用 EMR 可以解决扩展问题，但它增加了额外的复杂性。我想知道是否有更好且可能更简单的解决方案？谢谢你。

amazon-s3 amazon-web-services

Shu*_*uan

lucky-day

7
推荐指数

1
解决办法

4875
查看次数

无法升级分片mongoDB或停止平衡器

mongos没有在开始运行.当试图启动时,mongos我看到以下日志:

3月22日星期五17:43:13.383 [mongosMain]错误:错误将配置数据库升级到v4 ::由xongo配置元数据导致::更新版本4,当前版本为3,需要使用--upgrade运行mongos

但是使用--upgrade参数,我看到以下日志:

星期五3月22日17:43:39.273 [mongosMain]错误:将配置数据库升级到v4 ::由:: balancer导致的错误必须停止以进行配置升级

现在的问题是:我无法阻止平衡器,sh.stopBalancer()因为我无法启动mongos.现在这对我来说是一个僵局.请帮忙.

database-administration mongodb

Shu*_*uan

lucky-day

4
推荐指数

1
解决办法

4516
查看次数

我可以在golang的for-range迭代中创建索引int64吗？

按照规范的

for idx, val range a_slice

Run Code Online (Sandbox Code Playgroud)

语句返回idx为integer.

由于制作大尺寸片是可能的,是有办法的机会idx来int64？

谢谢.

arrays for-loop go slice

Shu*_*uan

2017 05-23

2
推荐指数

1
解决办法

1729
查看次数

python中函数调用之间的全局变量值丢失

我知道我一定错过了一些基本知识-只想确保我得到准确的答案。

我有以下代码。为什么CACHE_KEYS还没有之后load()又仍然没有CACHE？

import bisect
import csv

DB_FILE = "GeoLiteCity-Location.csv"

# ['locId', 'country', 'region', 'city', 'postalCode', 'latitude', 'longitude', 'metroCode', 'areaCode']
CACHE = []
CACHE_KEYS = None


def load():
    R = csv.reader(open(DB_FILE))

    for line in R:
        CACHE.append(line)

    # sort by city
    CACHE.sort(key=lambda x: x[3])

    CACHE_KEYS = [x[3] for x in CACHE]


if __name__ == "__main__":
    load()

    # test
    # print get_geo("Ruther Glen")

Run Code Online (Sandbox Code Playgroud)

python list-comprehension python-2.7

Shu*_*uan

lucky-day

1
推荐指数

1
解决办法

2365
查看次数