我正在尝试根据HTML <h2>和<h3>标签从HTML块(不是完整的文件 - 只是内容)生成目录.
到目前为止,我的计划是:
使用提取标题列表 beautifulsoup
在内容上使用正则表达式在标题标记之前/之内放置锚链接(这样用户可以单击目录) - 可能有一种替换内部的方法beautifulsoup?
输出指向预定义位置中标题的嵌套链接列表.
当我这样说时听起来很容易,但事实证明后方有点痛苦.
有什么东西可以一次性完成这一切所以我不会浪费下几个小时重新发明轮子吗?
一个例子:
<p>This is an introduction</p>
<h2>This is a sub-header</h2>
<p>...</p>
<h3>This is a sub-sub-header</h3>
<p>...</p>
<h2>This is a sub-header</h2>
<p>...</p>
Run Code Online (Sandbox Code Playgroud) 我xlwt在python中使用创建Excel电子表格.您可以将其与几乎任何生成文件的内容互换; 这就是我想要处理的重要文件.
from xlwt import *
w = Workbook()
#... do something
w.save('filename.xls')
Run Code Online (Sandbox Code Playgroud)
我希望我有两个文件用例:我将其流式传输到用户的浏览器或将其附加到电子邮件中.在这两种情况下,文件只需要存在生成它的Web请求的持续时间.
我得到的是,启动此线程的原因是保存到文件系统上的真实文件有其自身的障碍(停止覆盖,一旦完成就清理文件).有什么地方我可以"保存"它只存在于内存中并且仅在请求期间吗?
我正在尝试用uwsgi做一些非常复杂的配置.从长远来看,我正在努力让事情变得更容易,而且在这样做的过程中,我正在努力使事情变得如此艰难.
无论如何,我正在寻找完整的魔术变量列表.我在Emperor页面上找到的并不是我追求的.该页面(和其他人)表明那里有一个更大的魔法词典.某处.
%v = the vassals dir
%o = the original config filename as specified in the command line
%p = the absolute path of the config filename
%s = the filename of the config file
%d = the absolute path of the directory containing the config file
%e = the extension of the config file
%n = the filename without extension
Run Code Online (Sandbox Code Playgroud) 所以这是一个奇怪的问题,我怀疑这个问题很难解决.我正在为我家中的远程玩家构建一个歌词webapp.它目前生成一个他们正在播放的歌曲的球员字典.例如:
{
'bathroom': <Song: Blur - Song 2>,
'bedroom1': <Song: Blur - Song 2>,
'kitchen': <Song: Meat Loaf - I'd Do Anything for Love (But I Won't Do That)>,
}
Run Code Online (Sandbox Code Playgroud)
偶尔会同步这些玩家的子集.所以 - 在上面 - 它们显示相同的值.我想在界面中对这些进行分组.当我构建字典时,我可能会更聪明,但假设我不会这样做,是否有一种通过值合并键的好方法?
以上所需的输出将是:
{
'bathroom,bedroom1': <Song: Blur - Song 2>,
'kitchen': <Song: Meat Loaf - I'd Do Anything for Love (But I Won't Do That)>,
}
Run Code Online (Sandbox Code Playgroud)
然而,这确实打破了我想要查找的东西(我想通过名称指定,因此这是一个字典)...是否有一个更好的集合,每个值可以有多个键并指示何时合并重复(并向后 - 指向他们所有的键)?
有一个很好的答案可以将其翻到歌曲的关键字,并将播放列表作为一个值.这很棒,除了有时候我想知道哪首歌在一个指定的播放器上播放.这就是我最初使用字典的原因.
有没有一种很好的方法来保持两个方向的查找(没有保持两个集合)?
我使用Codesmith创建我们的代码生成模板,并通过查看示例模板和内置文档成功学习如何使用该工具.但是我想知道是否有其他资源(书籍,文章,教程等)可以更好地掌握Codesmith?
我有一个MultipleChoiceField拿着汽车制造的表格.我想将我的汽车数据库过滤到已检查的品牌,但这会导致问题.如何Q(make=...)动态获取所有语句?
我如何开始: ['value1', 'value2', ...]
我想如何结束: Q(col='value1') | Q(col='value2') | ...
我还有其他几种方法.我已经尝试为每个make添加查询集并以相反的方式执行(执行多个排除)但它们都非常慢.
我有一个文档列表,我想在网页上显示按名称的第一个字母分组的三个列.
简而言之,这样的事情:
A | C | E
A | D | F
B | D | F
B | D | F
| D |
Run Code Online (Sandbox Code Playgroud)
与Windows资源管理器视图风格的一个重要区别在于我希望字母相互保持一致.没有打破中间组.为了适应这种情况,我不在乎一列是否有一些条目太高.
我首先按名称对文档数组进行排序,然后将它们拆分为嵌套数组.所以我知道(或者很容易找到):
我不关心你的答案是什么.我正在寻找算法而不是实现,所以你可以编写你喜欢的任何东西(除了Fortran).HTML中的解释也可能是一个棘手的问题.
我邀请有人在标签上疯狂,因为我想不出任何相关和不,这不是作业,所以请不要这样标记.
我经常被 Python 中关于日期的事情绊倒。在我的 web 应用程序中,我想显示一个日历三周的每一天:上周、当前周和下周,星期一表示一周的开始。
我目前处理这个问题的方法是退回日期,直到我到达星期一,然后再减去 7 天,然后加上 20 天以建立三周范围......但这感觉真的很笨拙。
Python 是否有周的概念,还是我必须手动将其调整为几天?
编辑:现在我把它编码出来,它不是太可怕,但我确实想知道是否有更好的东西,再次使用几周而不是几天的概念。
today = datetime.date.today()
last_monday = today - datetime.timedelta(days=today.weekday()) - datetime.timedelta(days=7)
dates = [last_monday + datetime.timedelta(days=i) for i in range(0, 21)]
Run Code Online (Sandbox Code Playgroud) 假设我有一个Person模型:
class Person(models.Model):
name = models.CharField(max_length=50)
email = models.EmailField()
telephone = models.CharField(max_length=50)
Run Code Online (Sandbox Code Playgroud)
对于每个人,我想确保有联系信息.我不需要电子邮件和电话(虽然两者都可以)但我需要确保至少提供一个.
我知道我可以在表格中检查这些东西,但有没有办法在模型/数据库级别这样做以节省重复自己?
我一直在Django CMS安装中开发一些应用程序,并发现它可以很好地缓存我的订单.这可能不是生产中的问题,但在我测试布局时,不得不等待10分钟(或重新启动内存缓存)变得非常无聊.
我可以在开发设置中全局禁用Django CMS的缓存吗?