小编Sal*_*ish的帖子

提取最后一个点之后的子字符串

我想实现一个正则表达式来提取最后一个点之后的子字符串。例如，

a = c("a.b.c.d", "e.b.e", "c", "f.d.e", "a.e.b.g.z")
gsub(".*(\\..*)$", "\\1", a)

Run Code Online (Sandbox Code Playgroud)

代码返回

".d" ".e" "c"  ".e" ".z"

Run Code Online (Sandbox Code Playgroud)

如何修改代码才能得到

"d" "e" ""  "e" "z"

Run Code Online (Sandbox Code Playgroud)

也就是说，如果字符串中包含点，则会去掉最后不带点的部分；如果字符串不包含点，则返回“”。

regex r

Sal*_*ish

lucky-day

5
推荐指数

1
解决办法

2470
查看次数

通过使用 dplyr 添加前缀来重命名除 id 列之外的所有列

我有一个包含 id、feature_1、feature_2、feature_3 列的数据框，如下所示。

df = data.frame(
  id = sample(letters, 5),
  feature_1 = sample(1:10, 5),
  feature_2 = runif(5),
  feature_3 = rnorm(5)
)

Run Code Online (Sandbox Code Playgroud)

我想通过添加前缀来重命名所有特征列。以下行不起作用并输出错误。

df %>%
  rename_with(~(ifelse(names(.x) == "id", paste0("source_", names(.x)), "id")))

Error in names[cols] <- .fn(names[cols], ...) : 
  replacement has length zero

Run Code Online (Sandbox Code Playgroud)

关于如何修改这个的任何提示？.x 在 rename_with 中代表什么？提前致谢！

r rename dplyr

Sal*_*ish

2021 03-20

3
推荐指数

1
解决办法

101
查看次数

OpenAI GPT-3 API：微调是否有令牌限制？

在 GPT-3 API 的文档中，它说：

需要记住的一个限制是，对于大多数模型来说，单个 API 请求在提示和完成之间最多只能处理 2,048 个令牌（大约 1,500 个单词）。

在微调模型的文档中，它说：

训练样本越多越好。我们建议至少有几百个例子。一般来说，我们发现数据集大小每增加一倍都会导致模型质量线性增加。

我的问题是，1,500 字的限制是否也适用于微调模型？“数据集大小加倍”是否意味着训练数据集的数量而不是每个训练数据集的大小？

openai-api gpt-3

Sal*_*ish

2023 04-10

3
推荐指数

1
解决办法

4156
查看次数

标签统计

r ×2

dplyr ×1

gpt-3 ×1

openai-api ×1

regex ×1

rename ×1

提取最后一个点之后的子字符串

通过使用 dplyr 添加前缀来重命名除 id 列之外的所有列

OpenAI GPT-3 API：微调是否有令牌限制？

标签 统计

小编Sal_ish的帖子

标签统计