URL_Experiment我的数据库中有一个表(mySQL 数据库)。我在这个表中有 200 万个 URL 链接。
对于每个 URL,我正在检查 URL 中是否存在某些特定文本并将信息更新回我的URL_Experiment表中。
现在,我需要让脚本快速运行。我想到的简单解决方案是:
将它们URL_Experiment分成 10 个表(每个表有 200,000 行)并同时运行脚本 10 次。这样,我可以确保更新正确进行。但为此,我需要保存 10 个脚本,每个脚本访问正确的表(我需要将表从 1 重命名为 10)。
虽然以上看起来是一个非常巧妙的解决方案,但我正在寻找一个更复杂的解决方案。将同时(并行)执行相同脚本作为 10 个进程的东西。我关心的是执行时间。我不希望资源在可以利用的时候被浪费掉。
偶尔知道我的机器(Debian wheezy)最后一次被触碰的时间对我很有用。准确地说,我的意思是我最近在键盘上打字或移动鼠标的次数。当我目前尝试这样做时,我采用了临时方法,例如检查我正在编辑的文件的最后修改时间。但是,最系统的方法将是有用的。如果不是准确的时间,那么获得合理接近的估计的方法将是受欢迎的。我更喜欢使用不容易破坏的信息的方法,比如文件修改时间。
我想最终的方法是安装某种程序来监视我的计算机活动。我不知道我是否会走这么远,但至少愿意听听。
为此目的安装的任何软件都必须是免费的,并且可以在 Debian 中使用。话虽如此,解决方案不必特定于 Debian,甚至不必特定于 Linux。事实上,如果它们不是更好。
如果只考虑 X11 会话中的活动就可以了。
将视频文件刻录到 DVD 的标准 Unixy 命令行方法如下(假设)
# 1. First use ffmpeg to convert to an mpg file.
ffmpeg -i input.m4v -target ntsc-dvd output.mpg
# 2. now do the authoring
dvdauthor --title -o dvd -f output.mpg
dvdauthor -o dvd -T
Run Code Online (Sandbox Code Playgroud)
注意:--title设置 DVD 的标题,-T设置目录。在以上两个命令中,-o 开关都引用了一个目录,而不是实际的 dvd。
# 3. roll the .mpg file into an ISO file
genisoimage -dvd-video -o dvdimage.iso dvd
Run Code Online (Sandbox Code Playgroud)
最后,将生成的 iso 文件刻录到空白 DVD。我使用 Brasero,这是可靠的。
但是,此方法不适用于非标准纵横比。DVD 格式在指定可接受的纵横比方面非常严格。如果 dvdauthor 说类似的话,你就会知道你是否有这个问题
WARN: unknown mpeg2 aspect ratio 1
Run Code Online (Sandbox Code Playgroud)
修改此方法以处理非标准纵横比的好方法是什么?
更新:感谢 Anthony …
我认为我的 Debian 8.0 (Jessie) 安装已经过时,但Package Updater总是说All packages are up to date。
的结果:
sudo apt-get update
sudo apt-get -u upgrade
Run Code Online (Sandbox Code Playgroud)
是0 升级,0 新安装,0 删除和 0 未更新。
sudo apt-get -u dist-upgrade
Run Code Online (Sandbox Code Playgroud)
说的一样。
运行uname --all显示:
Linux DebianWorkstation 3.16.0-4-amd64
#1 SMP Debian 3.16.7-ckt7-1 (2015-03-01) x86_64 GNU/Linux
Run Code Online (Sandbox Code Playgroud)
但是官方消息称当前版本是 2015-04-25,当前的 Debian-Kernel 应该是 3.16.7-ctk9。我究竟做错了什么?
编辑-sources.list:
# deb cdrom:[Debian GNU/Linux stable _Jessie_ - Official Snapshot amd64 DVD Binary-1 20141222-06:43]/ jessie contrib main
deb http://ftp.de.debian.org/debian/ jessie main contrib …Run Code Online (Sandbox Code Playgroud) 考虑以下玩具示例:
this is a line
this line contains FOO
this line is not blank
This line also contains FOO
Some random text
This line contains FOO too
Not blank
Also not blank
More random text
FOO!
Yet more random text
FOO!
Run Code Online (Sandbox Code Playgroud)
所以,我想要 FOO 的 grep 的结果,但有额外的皱纹,应该包括匹配行之后的行,只要它们不是空白,并且它们本身不包含 FOO。因此匹配将如下所示,不同的匹配分开:
匹配 1
this line contains FOO
this line is not blank
Run Code Online (Sandbox Code Playgroud)
第 2 场
This line also contains FOO
Run Code Online (Sandbox Code Playgroud)
第 3 场
This line contains FOO too
Not blank
Also not blank
Run Code Online (Sandbox Code Playgroud)
第 …
我正在使用类似于 Ubuntu 的 Debian。
他们有 7 台点阵打印机,其中一些非常老旧(例如),这些打印机从 1979 年就开始使用了,打印文本的速度比许多喷墨打印机都要快。
我相信它有他自己的语言,因为将文本发送到串行端口(端口服务器)会打印垃圾。但是我认为只打印大写的英文,最多 95 个 ASCII 和希腊文,其余的最多 127 个我认为是希腊大写的。(特殊芯片)
我认为发送英文大写字母会打印垃圾,但我不确定,会再试一次。
其他打印机与 ESC/P 兼容,我使用 ghostscript 提供的通用 Epson 驱动程序。但是,我认为通过发送文本
lp -dpr1 filename
Run Code Online (Sandbox Code Playgroud)
将文本打印为图形,更改打印机的字体(courier、times roman 等)或间距无效。
我想知道是否有任何解决方法?在 AIX 中,他们声称该lp命令在打印时将输出打印为文本,而 Cobol 程序将原始文本发送到 lp 打印机。但是,在 AIX 中,它们为打印机使用了一些自定义过滤器,并为点阵打印机提供了更多选项。
我想知道是否有办法避免文本的图形模式并更改字体。
最直接的方法是不使用驱动程序,只需从 Cobol 发送 ESC/P,但这需要太多工作。
我试图获得一个与 PostgreSQL 数据库联系以在服务器上工作的 perl 脚本。这个脚本神秘地失败了。然后我意识到这localhost不在/etc/hosts文件中。
这台机器的文件(目前正在运行 Debian lenny)目前看起来像
127.0.0.1 machinename.domain machinename
xxx.xx.x.xxx machinename.domain machinename
Run Code Online (Sandbox Code Playgroud)
的xxx.xx.x.xxx是IP地址。我当前家用机器的文件,这是一个稍旧的安装(当前运行 Debian 挤压)是
127.0.0.1 machinename localhost
127.0.1.1 machinename.domain machinename
Run Code Online (Sandbox Code Playgroud)
我的家用机器位于路由器后面,没有直接暴露在互联网上。无论如何,我使用的是 DSL 并且没有静态 IP 地址。
/etc一段时间以来,我一直对我的机器进行版本控制(使用 etckeeper),我看到对于这台服务器,某些策划者(可能是我自己)在 2009 年 12 月 17 日进行了以下更改。
-127.0.0.1 localhost
+127.0.0.1 machinename.domain machinename
Run Code Online (Sandbox Code Playgroud)
我以前想知道为什么这个文件是这样设置的,但答案并不明显。一些问题:
为什么127.0.1.1?这可能是 Debian 特有的一段历史。我在网上搜索了一下,发现了一些关于 Gnome 的模糊的嘀咕,但几乎没有任何实质内容。
在 Debian 中,这个文件的模板是从哪里设置的?
目前是否认为该文件有正确/最佳形式?
行中名称的顺序是否重要?我希望不是。
更一般地说,为什么这两条线的结构是这样的?
现在,我想我会将服务器更改/etc/hosts为
127.0.0.1 machinename.domain machinename localhost
xxx.xx.x.xxx machinename.domain machinename
Run Code Online (Sandbox Code Playgroud)
注释?
我问是因为,例如,
https://en.wikipedia.org/wiki/Comparison_of_file_systems#Features
指出 EXT3 可以在线收缩。但是当我点击参考时:
“离线增长/收缩以及在线增长”
那么真相是什么呢?有人可以发布一个目前在线缩小的文件系统的小列表吗?
我最近尝试将我的 Nvidia 驱动程序替换为我的 Nvidia 卡的 Nouveau 驱动程序,(请参阅从 Nvidia 专有驱动程序切换到 Debian wheezy 上的 Nvidia 卡的 Nouveau 驱动程序)。
不幸的是,这次尝试失败并被烧毁,所以我中止了它。然而,在我重新启动到我的习惯配置并且烟雾消散之后,我发现了一些我已经知道的事情,即 Debian 只保留一份 X 服务器日志的副本,即/var/log/Xorg.0.log. 因此,我转向 Nouveau 的不幸尝试的日志已经丢失。
所以,我的问题是,如何更改 Debian 的配置以保留 X 日志文件的旧副本?:
我认为这种逻辑是由 logrotate 处理的,但是我可以看到/etc/logrotate.conf
,/etc/logrotate.d/对此没有任何具体的逻辑。只是在那里添加一些东西吗?如果是这样,我想知道为什么它已经不在了。
我见过好几次有未满足依赖关系的人,apt-get 并没有直接说明问题是什么,比如这个:
The following packages have unmet dependencies:
libgl1-mesa-dri:i386 : Depends: libdrm-intel1:i386 (>= 2.4.38) but it is not going to be installed
Depends: libdrm-nouveau2:i386 (>= 2.4.38) but it is not going to be installed
Depends: libdrm-radeon1:i386 (>= 2.4.31) but it is not going to be installed
Depends: libdrm2:i386 (>= 2.4.38) but it is not going to be installed
Depends: libglapi-mesa:i386 but it is not going to be installed
libgl1-mesa-glx:i386 : Depends: libdrm2:i386 (>= 2.3.1) but it is not going to …Run Code Online (Sandbox Code Playgroud) debian ×3
apt ×2
x11 ×2
bash ×1
burning ×1
cups ×1
dvd ×1
ffmpeg ×1
filesystems ×1
grep ×1
hosts ×1
logrotate ×1
monitoring ×1
networking ×1
printing ×1
scripting ×1
shell-script ×1
upgrade ×1