我有一个包含数千个与此类似的集合的列表:
set_list = [a, b, c, d]
Run Code Online (Sandbox Code Playgroud)
列表中的每个集看起来像这样:
a = set([1, 2, 3, 4, 5])
b = set([4, 5, 6, 7, 7, 9])
c = set([1, 2, 6, 8, 10, 12, 45])
d = set([11, 3, 23, 3, 4, 44])
Run Code Online (Sandbox Code Playgroud)
我想对列表中的每一组进行设置操作:X-(YUZUAUB ......等),例如,这看起来像这样:在set_list对新元素中的所有元素应用此操作之后像这样:
a = a.difference(b.union(c, d))
b = b.difference(c.union(a, d))
c = c.difference(d.union(b, a))
d = d.difference(a.union(c, b))
Run Code Online (Sandbox Code Playgroud)
我该怎么做到这一点?
我有像多列一个巨大的数据集x1,x2,x3...... x25,y1,y2,y3...... y50,z1,z2...... z10等,这些看起来是这样的:
x1 x2 x3 x4 y1 y2 y3
1 2 1 2 1 1 2
2 1 1 1 3 1 1
1 2 2 1 1 2 1
Run Code Online (Sandbox Code Playgroud)
我想要的是:
x_mean x_min x_max x_mad y_mean y_min y_max y_mad
1.5 1 2 0.74 2 1 2 0
1.25 1 2 0 2 1 2 0
1.5 1 2 0.74 …Run Code Online (Sandbox Code Playgroud) 我有一个 Pandas 数据框,看起来像这样:
text = ["abcd", "efgh", "ijkl", "mnop", "qrst", "uvwx", "yz"]
labels = ["label_1, label_2",
"label_1, label_3, label_2",
"label_2, label_4",
"label_1, label_2, label_5",
"label_2, label_3",
"label_3, label_5, label_1, label_2",
"label_1, label_3"]
df = pd.DataFrame(dict(text=text, labels=labels))
df
text labels
0 abcd label_1, label_2
1 efgh label_1, label_3, label_2
2 ijkl label_2, label_4
3 mnop label_1, label_2, label_5
4 qrst label_2, label_3
5 uvwx label_3, label_5, label_1, label_2
6 yz label_1, label_3
Run Code Online (Sandbox Code Playgroud)
我想将数据框格式化为如下所示:
text label_1 label_2 label_3 label_4 label_5
abcd 1.0 …Run Code Online (Sandbox Code Playgroud) 我有这个:
email = 'serebro@gmail.com'
Run Code Online (Sandbox Code Playgroud)
我想要一个正则表达式来得到这个:
output = ['serebro', 'gmail', 'com']
Run Code Online (Sandbox Code Playgroud)
即给定一个电子邮件地址,我想要一个列表,其中包含名称、company_name 及其域类型作为输出
我可以做这样的事情:
regex_1 = re.compile("(?:@|^)[^@]*")
regex_1.findall("serebro@gmail.com")
Run Code Online (Sandbox Code Playgroud)
这给了我:
['serebro', '@google.com']
Run Code Online (Sandbox Code Playgroud)
我如何['serebro', 'gmail', 'com']进入python