我在一家小型单一产品的客户公司工作,该公司正在向一家产品,多客户公司过渡.尽管我们只有一个客户,但我们有不同的项目,交付日期不同,但是对于每个项目,我们都能够提供最新的月度发布,我们已将其保存在单独的代码分支中,以防我们'必须为该特定版本提供错误修复.
最近,我们收购了许多新客户并出现了一个新问题:总部通常会解决(不破坏功能)许多不同的客户特定问题,并不是所有客户都希望所有的变化,而是宁愿选择樱桃 - 修复和功能.
您是否有过这种情况的经验,以及如何在不受测试和工作超负荷的情况下处理它(我们的每月发布测试需要大约3天的计算机时间)?和版本控制明智,你如何管理(我猜cvs最终将要去......)?
我正在寻找一种有效的,全熊猫的方法来创建一个带有组号的数组(对于原始数据帧中的每一行,我想要一个数字,告诉我这行属于哪个组):
df = pandas.DataFrame({'a': [1, 1, 1, 2, 2, 2], 'b': [1, 2, 1, 1, 2, 1]})
groups = df.groupby(['a', 'b'])
group_names = sorted(groups.groups.keys())
group_indices = np.array(df.index)
for index, group in enumerate(group_names):
group_indices[groups.indices[group]] = index
Run Code Online (Sandbox Code Playgroud)
哪里
In : df
Out]:
a b
0 1 1
1 1 2
2 1 1
3 2 1
4 2 2
5 2 1
In : groups.indices
Out:
{(1, 1): array([0, 2]),
(1, 2): array([1]),
(2, 1): array([3, 5]),
(2, 2): array([4])}
In : …Run Code Online (Sandbox Code Playgroud)