我有Atom编辑器,想知道如何在Atom中从终端打开文件或文件夹.我正在使用Mac.我正在寻找一种方法来做到这一点:
atom . (opens folder)
atom file.js (opens file)
atom (opens editor)
Run Code Online (Sandbox Code Playgroud)
这是可能的,我该如何设置?
我想使用Python从HTML文件中提取文本.如果我从浏览器复制文本并将其粘贴到记事本中,我想要的输出基本相同.
我想要比使用可能在格式不正确的HTML上失败的正则表达式更强大的东西.我见过很多人推荐Beautiful Soup,但是我使用它时遇到了一些问题.首先,它选择了不需要的文本,例如JavaScript源代码.此外,它没有解释HTML实体.例如,我希望' 在HTML源代码中转换为文本中的撇号,就像我将浏览器内容粘贴到记事本中一样.
更新 html2text看起来很有希 它正确处理HTML实体并忽略JavaScript.但是,它并不完全产生纯文本; 它会产生降价,然后必须将其转换为纯文本.它没有示例或文档,但代码看起来很干净.
相关问题:
我需要能够使用Windows和Mac OS中的默认应用程序打开文档.基本上,我想做同样的事情,当你在资源管理器或Finder中双击文档图标时发生的事情.在Python中执行此操作的最佳方法是什么?
将以下内容粘贴到浏览器上时,以下内容有效:
http://www.somesite.com/details.pl?urn=2344
Run Code Online (Sandbox Code Playgroud)
但是,当我尝试使用Python读取URL时,没有任何反应:
link = 'http://www.somesite.com/details.pl?urn=2344'
f = urllib.urlopen(link)
myfile = f.readline()
print myfile
Run Code Online (Sandbox Code Playgroud)
我需要对URL进行编码,还是有些东西我没看到?
我有这个函数引用文件的路径:
some_obj.file_name(FILE_PATH)
Run Code Online (Sandbox Code Playgroud)
其中FILE_PATH是文件路径的字符串,即 H:/path/FILE_NAME.ext
我想在我的python脚本中创建一个文件FILE_NAME.ext,其中包含字符串的内容:
some_string = 'this is some content'
Run Code Online (Sandbox Code Playgroud)
怎么去这个?Python脚本将放在Linux框中.
我正在尝试使用正则表达式搜索网页,但我收到以下错误:
TypeError:不能在类字节对象上使用字符串模式
我理解为什么,urllib.request.urlopen()返回一个字节流,所以,至少我猜测,重新不知道要使用的编码.在这种情况下我该怎么办?有没有办法在urlrequest中指定编码方法,或者我需要自己重新编码字符串?如果是这样我想要做什么,我假设我应该从头信息或编码类型中读取编码,如果在html中指定,然后重新编码为它?
我想用它tempfile.NamedTemporaryFile()来写一些内容然后打开那个文件.我写了以下代码:
tf = tempfile.NamedTemporaryFile()
tfName = tf.name
tf.seek(0)
tf.write(contents)
tf.flush()
Run Code Online (Sandbox Code Playgroud)
但我无法打开此文件,并在记事本或类似的应用程序中查看其内容.有没有办法实现这个目标?为什么我不能这样做:
os.system('start notepad.exe ' + tfName)
Run Code Online (Sandbox Code Playgroud)
在末尾