小编jej*_*uba的帖子

命令行将目录(和子目录)中的所有 .docx 转换为文本文件并写入新文件

我想从命令行将目录(和子目录)中的所有 .docx 文件转换为文本文件(这样我可以在这些文件上使用 grep after )。我找到了这个

unzip -p tutu.docx word/document.xml | sed -e 's/<\/w:p>/\n/g; s/<[^>]\{1,\}>//g; s/[^[:print:]\n]\{1,\}//g'
Run Code Online (Sandbox Code Playgroud)

这里效果很好,但它在终端中发送文件。我想将新的文本文件(例如 .txt)写入与 .docx 文件相同的目录中。我想要一个脚本来递归地执行此操作。

我有这个,使用反词,可以完成我想要的 .doc 文件,但它不适用于 .docx 文件。

find . -name '*.doc' | while read i; do antiword -i 1 "${i}" >"${i/doc/txt}"; done
Run Code Online (Sandbox Code Playgroud)

我尝试将两者混合,但没有成功...能够同时执行这两项操作的命令行将不胜感激!

谢谢

grep doc unzip

3
推荐指数
1
解决办法
3133
查看次数

如何在R中的整个data.frame中替换多个因子

我想用另一个因素(不是级别的一部分)替换data.frame中的各种因素.例如:

au1 <- c('deb', 'art', 'deb', 'seb', 'deb', 'deb', 'mar', 'mar', 'joy', 'deb')
au2 <- c('art', 'deb', 'soy', 'deb', 'joy', 'ani', 'deb', 'deb', 'nem', 'mar')
au3 <- c('mar', 'lio', 'mil', 'mar', 'ani', 'lul', 'nem', 'art', 'deb', 'tat')

tata <- data.frame(au1, au2, au3)
Run Code Online (Sandbox Code Playgroud)

我想用'XXX'改变所有'deb'和'joy'.

找不到办法做到这一点.我很难为整个data.frame添加一个级别,并且在%c('','')中使用%来表示data.frame.

任何的想法?

r

2
推荐指数
1
解决办法
1428
查看次数

r igraph:从2组向量中去除边缘

我正试图通过我的出版网络联系我的合作.我用的是igraph,它很棒.但是,由于我的顶点(代表我在网络中的那个)的边缘到所有共同作者,我最终得到了一个非常丰富的图形.我想从我的顶点删除边缘到一些只与另一位作者相关的作者.基本上是我只是共同创作的作者.无论如何,我已经确定了这些顶点,我知道我的顶点.现在我找不到一种方法来删除将这组边连接到我的边.

更一般地说,如何从两组矢量中去除边缘,例如V(g)[a]和V(g)[b]?

谢谢,

这是一个例子:

au1 <- c('deb', 'art', 'deb', 'seb', 'deb', 'deb', 'mar', 'mar', 'joy', 'deb')
au2 <- c('art', 'deb', 'soy', 'deb', 'joy', 'ani', 'deb', 'deb', 'nem', 'mar')
au3 <- c('mar', 'lio', 'mil', 'mar', 'ani', 'lul', 'nem', 'art', 'deb', 'tat')


tata <- data.frame(au1, au2, au3)
xaulist2 <- levels(factor(unlist(tata[,])))
xaulist <- levels(as.factor(xaulist2))
xaulist_att <- c(rep('prime', 2), 'main', 'second', 'second', rep('prime', 3), 'second', rep('prime', 3))
au_att <- data.frame(au_name=xaulist, level=xaulist_att)

# matrix list preparation
tutu <- matrix(NA, nrow=length(xaulist), ncol=dim(tata)[1]) # row are authors …
Run Code Online (Sandbox Code Playgroud)

r igraph

0
推荐指数
1
解决办法
1988
查看次数

标签 统计

r ×2

doc ×1

grep ×1

igraph ×1

unzip ×1