Raku 递归正则表达式语法和 Raku 中的所有匹配变量是什么或如何作为尝试
'hellohelloworldworld' ~~ m{ ^(h\w+?o) (?0) world };
say "\n=$&"
Run Code Online (Sandbox Code Playgroud)
似乎不起作用
请帮忙解决这些问题。
我正在用 Markdown 编写网页,并使用md2html工具将它们转换为 HTML。我想处理输出 HTML 文件并找到任何 YouTube 链接,如下所示:
<a href="https://www.youtube.com/watch?v=abcdefgh887">https://www.youtube.com/watch?v=abcdefgh887</a>
并将其替换为嵌入代码:
<iframe width="560" height="315" src="https://www.youtube.com/embed/abcdefgh887?controls=0" title="YouTube video player" frameborder="0" allow="accelerometer; autoplay; clipboard-write; encrypted-media; gyroscope; picture-in-picture" allowfullscreen></iframe>
我对语法进行了一些尝试,主要是为了熟悉它们,但得出的结论是,这可能不是完成这项工作的理想工具。另外,我更喜欢使用可以轻松适应其他类似任务的现有模块,而不是推出自己的半生不熟的解决方案。
Perl5 对于此类事情有一些很好的工具,但我想使用纯 Raku 解决方案,这样我可以了解更多 Raku。
对于解决这个问题的好方法有什么建议吗?
我们如何将 Match(或其他)对象展平或字符串化为字符串数据类型(尤其是大量,即作为数组元素)?例如
'foobar' ~~ m{ (foo) };
say $0.WHAT;
my $foo = $0;
say $foo.WHAT
Run Code Online (Sandbox Code Playgroud)
(Match)
(Match)
Run Code Online (Sandbox Code Playgroud)
结局如何(Str)?
我在运行评估报告时收到此错误。我使用 bert-base-german-cased 为我的自定义数据集训练了我的模型。
代码如下:
from sklearn.metrics import confusion_matrix
...
tn, fp, fn, tp = confusion_matrix(labels, preds).ravel()
Run Code Online (Sandbox Code Playgroud)
错误是
ValueError Traceback (most recent call last)
<ipython-input-33-0d7757abd7dd> in <module>
10 model = model_class.from_pretrained(checkpoint)
11 model.to(device)
---> 12 result, wrong_preds = evaluate(model, tokenizer, prefix=global_step)
13 result = dict((k + '_{}'.format(global_step), v) for k, v in result.items())
14 results.update(result)
<ipython-input-30-c0946f859f89> in evaluate(model, tokenizer, prefix)
76 elif args['output_mode'] == "regression":
77 preds = np.squeeze(preds)
---> 78 result, wrong = compute_metrics(EVAL_TASK, preds, out_label_ids)
79 results.update(result)
80
<ipython-input-30-c0946f859f89> …Run Code Online (Sandbox Code Playgroud) 我有以下问题。我的数据框中有一个 date_time 列(以及许多其他列)。
df["Date_time"].head()
0 2021-05-15 09:54
1 2021-05-27 17:04
2 2021-05-27 00:00
3 2021-05-27 09:36
4 2021-05-26 18:39
Name: Date_time, dtype: object
Run Code Online (Sandbox Code Playgroud)
我想将此列分成两部分(日期和时间)。
我使用这个效果很好的公式:
df["Date"] = ""
df["Time"] = ""
def split_date_time(data_frame):
for i in range(0, len(data_frame)):
df["Date"][i] = df["Date_time"][i].split()[0]
df["Time"][i] = df["Date_time"][i].split()[1]
split_date_time(df)
Run Code Online (Sandbox Code Playgroud)
但有没有更优雅的方式呢?谢谢
我创建了一个由两列组成的数据框。我想计算这两列出现的次数。
数据框看起来像 -
No Name
1 A
1 A
5 T
9 V
Nan M
5 T
1 A
Run Code Online (Sandbox Code Playgroud)
我想使用 value_counts() 来获取这样的数据框-
No Name Count
1 A 3
5 T 2
9 V 1
Nan M 1
Run Code Online (Sandbox Code Playgroud)
我试过df[["No", "Name"]].value_counts()计算除 nan 行以外的所有内容。有没有办法使用 value_counts() 来计数Nan?
我在锦标赛的不同轮次中df重复了一个 with ,如下所示:names
name round_id price_open
John 1 5.0
Paul 1 4.0
John 2 5.4
Paul 2 3.4
John 3 5.0
Paul 3 4.0
Run Code Online (Sandbox Code Playgroud)
但在第 3 轮,一名新玩家进入锦标赛:
...
George 3 6.0
...
Run Code Online (Sandbox Code Playgroud)
假设我需要过滤所有起始价格,如下所示:
df_open = df[df['round_id']==1]['price_open']
Run Code Online (Sandbox Code Playgroud)
这对乔治来说是好事NaN,但这不是我需要的。
那么我如何过滤这个 df 以获得所有玩家的第一个开盘价格,最终是什么呢?
name price_open
John 5.0
Paul 4.0
George 6.0
Run Code Online (Sandbox Code Playgroud) 这是我在这里的第一个问题。
我想知道如何从这个:
[1,1,2,'-','-',3,3,'-','-','-','-','-',5,5,'-','-','-']
Run Code Online (Sandbox Code Playgroud)
找到'-'这种形状的符号的出现:[2,5,3]