小编Shu*_*uan的帖子

如何从另一个ipython-notebook导入?

我想从另一个ipython-notebook导入一个func.说,

common_func.ipnb 具有 def func_a()

当我创建一个新笔记本时,如何func_a从另一个笔记本中访问哪个笔记本,但是在同一个文件夹和相同的ipython实例中?

谢谢!

ipython jupyter-notebook

43
推荐指数
4
解决办法
3万
查看次数

如何使用python以编程方式测量HTML源代码中元素的大小?

我在python中进行网页布局分析.基本任务是以给定HTML源代码的方式编程测量元素的大小,以便我们可以获得网页语料库的内容/广告比率,广告块位置,广告块大小的统计数据.

一种显而易见的方法是使用width/height属性,但它们并不总是可用.此外,width: 50%需要在加载到DOM后计算.所以我想将HTML源代码加载到一个窗口大小的预定义浏览器中(比如机械化虽然我不确定窗口的大小是否可以设置)是一种很好的尝试方法,但机械化不支持返回元素大小无论如何.

在python中有没有通用的方法(没有宽度/高度属性),最好是用一些库?

谢谢!

html python dom

7
推荐指数
1
解决办法
1439
查看次数

如何在scikit-learn DecisionTreeRegressor中使用实际的功能名称而不是"X"?

我想这是可能的,因为在fit函数的def中它说:

X:类似数组,shape = [n_samples,n_features]

我现在有,

在此输入图像描述

我当然可以生成决策树的字符串表示,然后X[]用实际的功能名称替换.但我想知道该fit函数是否可以直接将特征名称作为输入的一部分?我为每个样本尝试了以下格式

  • [1,2,"feature_1","feature_2"]

  • [[1,2],["feature_1","feature_2"]]

但都没有奏效.这是什么shape意思?你能举个例子吗?

python scikit-learn

7
推荐指数
1
解决办法
8854
查看次数

如何在北京(中国)存储桶和全球存储桶之间同步 S3 中的数据?

北京(中国)地区非常独特,因为它几乎所有的东西都是独立的(与 AWS 全球分开)。例如,要使用 AWS CLI 列出我们必须指定的对象regionendpoint-url

aws --region cn-north-1 \
  --endpoint-url https://s3.cn-north-1.amazonaws.com.cn \
  --profile AN_AWS_CN_PROFILE \
  s3 ls s3://AN_AWS_CN_BUCKET/
Run Code Online (Sandbox Code Playgroud)

我的问题是如何在北京(中国)存储桶和全球存储桶之间同步数据?首先,无法使用指定的region&识别全局存储桶endpoint-url。例如,

aws --region cn-north-1 \
  --endpoint-url https://s3.cn-north-1.amazonaws.com.cn \
  --profile AN_AWS_CN_PROFILE \
  s3 cp s3://AN_AWS_CN_BUCKET/ s3://AN_AWS_IRELAND_BUCKET/
Run Code Online (Sandbox Code Playgroud)

会给

致命错误:调用ListObjects操作时发生错误(NoSuchBucket):指定的bucket不存在

(目标存储桶确实存在。)

到目前为止,我已经探索了 CLI 参数和.aws/config文件来定义配置文件。也许有可能使用多个profile在一个单一的命令,但它似乎并不可能配置endpoint-url.aws/config,因为没有提到它在这里

现在我只是将文件复制到本地然后上传,随着数据集的快速增长,这将成为一个问题。使用 EMR 可以解决扩展问题,但它增加了额外的复杂性。我想知道是否有更好且可能更简单的解决方案?谢谢你。

amazon-s3 amazon-web-services

7
推荐指数
1
解决办法
4875
查看次数

无法升级分片mongoDB或停止平衡器

mongos没有在开始运行.当试图启动时,mongos我看到以下日志:

3月22日星期五17:43:13.383 [mongosMain]错误:错误将配置数据库升级到v4 ::由xongo配置元数据导致::更新版本4,当前版本为3,需要使用--upgrade运行mongos

但是使用--upgrade参数,我看到以下日志:

星期五3月22日17:43:39.273 [mongosMain]错误:将配置数据库升级到v4 ::由:: balancer导致的错误必须停止以进行配置升级

现在的问题是:我无法阻止平衡器,sh.stopBalancer()因为我无法启动mongos.现在这对我来说是一个僵局.请帮忙.

database-administration mongodb

4
推荐指数
1
解决办法
4516
查看次数

我可以在golang的for-range迭代中创建索引int64吗?

按照规范

for idx, val range a_slice 
Run Code Online (Sandbox Code Playgroud)

语句返回idxinteger.

由于制作大尺寸片是可能的,是有办法的机会idxint64

谢谢.

arrays for-loop go slice

2
推荐指数
1
解决办法
1729
查看次数

python中函数调用之间的全局变量值丢失

我知道我一定错过了一些基本知识-只想确保我得到准确的答案。

我有以下代码。为什么CACHE_KEYS还没有之后load()又仍然没有CACHE

import bisect
import csv

DB_FILE = "GeoLiteCity-Location.csv"

# ['locId', 'country', 'region', 'city', 'postalCode', 'latitude', 'longitude', 'metroCode', 'areaCode']
CACHE = []
CACHE_KEYS = None


def load():
    R = csv.reader(open(DB_FILE))

    for line in R:
        CACHE.append(line)

    # sort by city
    CACHE.sort(key=lambda x: x[3])

    CACHE_KEYS = [x[3] for x in CACHE]


if __name__ == "__main__":
    load()

    # test
    # print get_geo("Ruther Glen")
Run Code Online (Sandbox Code Playgroud)

python list-comprehension python-2.7

1
推荐指数
1
解决办法
2365
查看次数