删除 csv 文件中整数周围的引号

Bal*_*eth 4 command-line scripts sed text-processing

在一个大（> 1 GB）的csv文件中，我有类似的东西

"34432", "name", "0", "very long description"

Run Code Online (Sandbox Code Playgroud)

但与其说是我想要

34432, "name", 0, "very long description".

Run Code Online (Sandbox Code Playgroud)

我正在查看，sed但这项任务超出了我的范围。

任何建议如何实现这一目标？

使用 perl：

perl -ne 's/"(\d+)"/$1/g; print' file.csv > new_file.txt

Run Code Online (Sandbox Code Playgroud)

所有的工作都由s/"(\d+)"/$1/g哪里完成

s/patternA/patternB/用于替换patternA为patternB
然后 perl 查找一个或多个\d+由双引号括起来的数字。
( \d+)周围的括号用于捕获数字并将它们重用作为具有 perl 特殊变量的替换模式$1。

应该适用于这种情况的 GNU sed 正则表达式是

sed -r 's/"([0-9]+)"/\1/g'

Run Code Online (Sandbox Code Playgroud)

对于纯 sed，您需要转义分组括号和+修饰符

sed 's/"\([0-9]\+\)"/\1/g'

Run Code Online (Sandbox Code Playgroud)

您可以使用某些版本的 sed 执行就地替换，例如

sed -ri 's/"([0-9]+)"/\1/g' file.csv

Run Code Online (Sandbox Code Playgroud)

您还可以使用 POSIX 类[[:digit:]]代替字符范围[0-9]

你对问题的描述不是很具体。我假设您只想删除第一个和第三个字段周围的双引号。如果是这样，其中任何一个都应该有效：

sed
```
sed -r 's/^"([^"]+)"(\s*,\s*[^,]+)\s*,\s*"([^"]+)"/\1\2, \3/' file.csv
```
Run Code Online (Sandbox Code Playgroud)
解释

在-r启用扩展正则表达式，允许我们使用括号来捕捉模式，而无需逃避它们。因此，我们匹配行首的引号 ( ^")，然后是一个或多个非引号字符 ( [^"]+)，然后是结束引号，接着是 0 个或多个空格、一个逗号，然后又是 0 个或多个空格 ( \s*,\s*) ，然后是一段非逗号，直到下一个逗号（这定义了第二个字段）。最后，我们查找 0 个或多个空格、一个逗号，并将其替换为第一个捕获的模式 ( \1)，然后是第二个 ( \2)、一个逗号、一个空格和第三个。
珀尔
```
perl -pe 's/^"([^"]+)"(\s*,\s*[^,]+)\s*,\s*"([^"]+)"/$1$2, $3/; ' file.csv
```
Run Code Online (Sandbox Code Playgroud)
解释

这-p意味着在应用通过的脚本后打印每一行-e。脚本本身与sed上面的正则表达式基本相同。只有在这里，捕获的模式是$1。
awk
```
awk -F, -v OFS="," '{gsub("\"","",$1)0gsub("\"","",$3);}1;' file.csv 
```
Run Code Online (Sandbox Code Playgroud)
解释

该-F设置字段分隔符,。OFS是输出字段分隔符，它也被设置为,正确打印行。由于我们在第一个 ( ) 和第三个字段 ( )上运行它gsub，因此进行替换，将所有"内容替换为空，它只会从这些字段中删除引号。这只是“打印行”的简写。$1$31;awk

归档时间：	11 年，7 月前
查看次数：	6407 次
最近记录：	8 年，8 月前

Vim：以尾随的感叹号退出 (:wq)！目的是什么？ 16

Bash 需要大量时间来加载 11

哪个 TPM 版本？ 8

无法使用“apt-get”进行更新，出现“429 请求过多”错误 6

Linux 从脚本解压文件而不输出解压文件名 4

无法从终端运行 python 文件 3

将所有目录和子文件夹中的 zip 文件（不含文件夹本身） 3

查找并删除所有以 . 在目录中 2

Cron.daily Exec 格式错误 2

var="$(date +"%x %r %Z")" 对应的日期命令行是什么 2

如何提取页面范围/PDF 的一部分？ 623

如何从 SSH 私钥中检索公钥？ 521

如何找出包来自哪个存储库？ 219

如何一次将多个文件移动到特定的目标目录？ 185

apt-get -y install 命令中的 -y 是什么意思？ 159

如何在整个硬盘驱动器中搜索文件？ 156

您如何获得所有启动服务的列表？ 153

反转两指滚动方向（自然滚动）？ 133

如何创建本地 APT 存储库？ 120

查看在终端中运行的命令的历史记录 113