我们如何从维基百科复制没有引用部分“[1]”、“[2]”、“[3]”的文本？

Question

我们如何从维基百科复制没有引用部分“[1]”、“[2]”、“[3]”的文本？

如果我们从Wikipedia 页面复制文本，我们大致会得到以下内容：

句子间距是排版文本中句子之间的水平间距。这是印刷约定的问题。^[1]自从在欧洲引入活字印刷术以来，各种句子间距约定已用于具有拉丁文衍生字母的语言。^[2]这些包括一个普通的词空间（如句子中的词之间）、一个放大的空格、两个完整的空格，以及最近在数字媒体中没有空格。^[3]尽管现代数字字体可以自动调整单个单词空间以在终端标点符号后创建视觉上令人愉悦且一致的间距，^[4] 大多数争论是关于是否在句子之间敲击键盘的空格键一次或两次。^[5]

我不希望将部分复制^[1]和^[2]等，这实际上是我想要的东西复制：

句子间距是排版文本中句子之间的水平间距。这是印刷约定的问题。自从在欧洲引入活字印刷以来，各种句子间距约定已用于具有拉丁文派生字母表的语言。这些包括一个普通的词空间（如句子中的词之间）、一个放大的空格、两个完整的空格，以及最近在数字媒体中没有空格。尽管现代数字字体可以自动调整单个单词空间以在终端标点符号后创建视觉上令人愉悦且一致的间距，但大多数争论是关于是否在句子之间敲击键盘的空格键一次或两次。

下面选定的答案使用正则表达式，但并非每次都有效。（如果实际文本本身包含[并且]正则表达式不应该删除它们。）

有更好的解决方案吗？

Answer 1

Stu*_*lin 12

书签是您的朋友...

创建一个新的浏览器书签并将下面的 javascript 代码复制到其中 - 当您想从维基百科复制一些文本时，只需事先单击它，它就会删除^{[n] 的}所有实例以满足您在问题中的要求。

javascript:function a (){document.body.innerHTML=document.body.innerHTML.replace(/<sup\b[^>]*>(.*?)<\/sup>/gi, "" );return;}; a();

在幕后，它只是进行正则表达式搜索并替换<sup>...</sup>页面上的所有HTML 标签。

我刚刚在 IE7 中尝试过这个，它工作正常，所以希望在其他浏览器中也可以。

我会相信这个 SO 线程为我指明了正确的方向 - 我知道书签是要走的路，但以前从未写过。

归档时间：	14 年，5 月前
查看次数：	8781 次
最近记录：	7 年前