我正在尝试为获取的网页提取元描述.但在这里,我面临的是BeautifulSoup区分大小写的问题.
有些页面有<meta name="Description,有些有<meta name="description.
我的问题非常类似于Stackoverflow上的问题
唯一的区别是我不能使用lxml ..我必须坚持使用Beautifulsoup.
基本上我有这样的模型:
class Playlist(models.Model):
key = models.CharField(max_length=255,blank=True, unique=True)
user = models.ForeignKey(User)
title = models.CharField(max_length=200)
pub_date = models.DateTimeField(auto_now_add=True)
videos = models.ManyToManyField(Video, through='PlaylistVideo')
class PlaylistVideo(models.Model):
playlist = models.ForeignKey(Playlist)
video = models.ForeignKey(Video)
position = models.IntegerField()
class Video(models.Model):
title = models.CharField(max_length=255,blank=True)
description = models.TextField(blank=True)
thumb = models.URLField(blank=True)
duration = models.IntegerField(default=0)
Run Code Online (Sandbox Code Playgroud)
现在我想要一个API来返回这样的PLAYLISTS ...但是视频应该按PlaylistVideo模型中的POSITION排序
{
"key": "h8x3",
"title": "First Playlist",
"pub_date": "2012-10-11T17:00:26Z",
"videos": [
{
....
},
{
....
}
]
},
Run Code Online (Sandbox Code Playgroud)
我该怎么办呢?
我正在寻找一个django博客应用程序来运行我的博客.
我找到了以下选项:
你能分享一下你的推荐吗?
我的基本要求是: - 易于定制 - 具有基本的博客功能
我一直在尝试将doc/docx文件转换为html,我发现最好的选择是docx4j.任何人都可以帮我直接命令行来完成这项工作.
我试过了:
java -cp docx4j.jar:log4j-1.2.15.jar org.docx4j.samples.CreateHtml [input.docx]
Run Code Online (Sandbox Code Playgroud)
作为回应,我希望HTML输出(无论是控制台还是文件).