小编sim*_*leo的帖子

Github:将上游分支导入fork

我有一个origin来自upstreamgithub上的project()的fork().现在上游项目添加了一个新分支,我想导入我的fork.我怎么做?

我尝试检查远程并在其上创建一个分支,但是将分支配置git push为尝试推送到的分支upstream:

git checkout upstream/branch
git checkout -b branch
Run Code Online (Sandbox Code Playgroud)

编辑

也许这不清楚,但我想将分支添加到我的本地存储库,所以我可以将它推送到origin(我的fork)git push.因为上游存储库通常是只读的,所以你可以将其分配给贡献.

所以我基本上想要检查一个不存在的分支,origin其内容将从中拉入upstream.

git github

158
推荐指数
4
解决办法
6万
查看次数

生成python中间隔之间的月份列表

我想生成一个包含两个日期之间所有月份的python列表,输入和输出格式如下:

date1 = "2014-10-10"  # input start date
date2 = "2016-01-07"  # input end date
month_list = ['Oct-14', 'Nov-14', 'Dec-14', 'Jan-15', 'Feb-15', 'Mar-15', 'Apr-15', 'May-15', 'Jun-15', 'Jul-15', 'Aug-15', 'Sep-15', 'Oct-15', 'Nov-15', 'Dec-15', 'Jan-16']  # output
Run Code Online (Sandbox Code Playgroud)

python python-2.7

26
推荐指数
6
解决办法
3万
查看次数

如何在MapReduce作业中导入自定义模块?

我定义了一个MapReduce作业main.py,从中导入lib模块lib.py.我使用Hadoop Streaming将此作业提交到Hadoop集群,如下所示:

hadoop jar /usr/lib/hadoop-mapreduce/hadoop-streaming.jar -files lib.py,main.py 
    -mapper "./main.py map" -reducer "./main.py reduce" 
    -input input -output output
Run Code Online (Sandbox Code Playgroud)

在我的理解,这应该把两者main.pylib.py进入分布式缓存文件夹中的每个计算设备上,从而使模块lib可用main.但它没有发生:从日志中我看到文件真的被复制到同一目录,但main无法导入lib,抛出ImportError.

为什么会发生这种情况,我该如何解决?

UPD.将当前目录添加到路径不起作用:

import sys    
sys.path.append(os.path.realpath(__file__))
import lib
# ImportError
Run Code Online (Sandbox Code Playgroud)

但是,手动加载模块可以解决问题:

import imp
lib = imp.load_source('lib', 'lib.py')
Run Code Online (Sandbox Code Playgroud)

但这不是我想要的.那么为什么Python解释器会.py在同一目录中看到其他文件,但却无法导入它们?请注意,我已经尝试将空__init__.py文件添加到同一目录而不起作用.

python mapreduce hadoop-streaming

10
推荐指数
2
解决办法
6526
查看次数

标签 统计

python ×2

git ×1

github ×1

hadoop-streaming ×1

mapreduce ×1

python-2.7 ×1