小编Ter*_*den的帖子

从超大文件中删除一行的快速方法

我有一个 67GB 的 .csv 文件(我知道...我知道...)

我需要从文件中删除第 4,125,878 行,因为它已损坏。我的 CSV 解析工具不会忽略或跳过它。

可以sed做类似的东西

sed '4125878d' in.csv > out.csv

但就时间和磁盘空间而言,这将是一项非常昂贵的操作。

如果我使用sed -i '4125878d' in.csv,则操作需要很长时间。

有没有办法可以快速从一个大文件的中间删除一行?

command-line sed csv files

5
推荐指数
1
解决办法
6260
查看次数

减小带有文本的 PDF 文件大小?

我有一个用PDF Sandwich创建的 PDF 。PDF 的每一页都包含一个背景图像和一些前景文本。

\n

我想减小背景图像的文件大小(而不是分辨率) - 并保留可选择的文本。

\n
    \n
  • 使用 ImageMagick 可以convert减小尺寸,但会删除文本。
  • \n
  • ps2pdf不会显着减小文件大小。
  • \n
  • gs -sDEVICE=pdfwrite -dPDFSETTINGS=/screen \xe2\x80\xa6降低分辨率,但似乎没有重新压缩图像。
  • \n
  • qpdf --compress-streams=y --recompress-flate --optimize-images in.pdf out.pdf只会产生微小的差异。
  • \n
\n

如果我提取背景图像并使用pngquant或类似的图像,文件大小会大大减小。但我无法使用新图像来替换旧图像。

\n

有什么方法可以压缩 PDF 中的图像,同时保持文本完整吗?

\n
\n

正如评论中所建议的,运行pdfimages -list output.pdf

\n

给出:

\n
page   num  type   width height color comp bpc  enc interp  object ID x-ppi y-ppi size ratio\n--------------------------------------------------------------------------------------------\n   1     0 image    3483  4800  rgb     3   8  jpeg   no        11 …
Run Code Online (Sandbox Code Playgroud)

compression pdf

5
推荐指数
1
解决办法
1040
查看次数

向 Dropbox 子文件夹授予 www-data 权限?

我想授予我的网站从 Dropbox 子文件夹读取文件和文件夹的权限。

我已经添加了正确的权限,但我无法让www-data用户访问文件夹。

$ cd /home/edent/Dropbox
$ ls -la
total 9944
drwxrwxr-x    6 edent edent       4096 Aug 14  2012 .
drwx------   67 edent edent      20480 Feb 27 09:11 ..
drwxrwxr-x+ 772 edent www-data  118784 Jan 29 20:45 Foo
drwxrwxr-x    4 edent edent       4096 Aug 14  2012 Bar
Run Code Online (Sandbox Code Playgroud)

的所有子文件夹和文件Foo也是drwxrwxr-x+ edent www-data

所以,我切换到用户,www-data但它没有访问这些文件和文件夹的权限!

$ sudo su www-data
$ groups
www-data
$ id
uid=33(www-data) gid=33(www-data) groups=33(www-data)
$ cd /home/edent/Dropbox/Foo
sh: 3: cd: can't …
Run Code Online (Sandbox Code Playgroud)

acl permissions apache-httpd

4
推荐指数
1
解决办法
1934
查看次数

标签 统计

acl ×1

apache-httpd ×1

command-line ×1

compression ×1

csv ×1

files ×1

pdf ×1

permissions ×1

sed ×1