我需要解析一个url以获取链接到详细信息页面的URL列表.然后,从该页面我需要从该页面获取所有详细信息.我需要这样做,因为详细页面URL不会定期递增和更改,但事件列表页面保持不变.
基本上:
example.com/events/
<a href="http://example.com/events/1">Event 1</a>
<a href="http://example.com/events/2">Event 2</a>
example.com/events/1
...some detail stuff I need
example.com/events/2
...some detail stuff I need
Run Code Online (Sandbox Code Playgroud) 我试图使用sed替换文件的html元素的每一个出现,所以我可以交替颜色行.
这是我尝试过的,它不起作用.
sed 's/<tr valign=top>/<tr valign=top bgcolor='#E0E0E0'>/2' untitled.html
Run Code Online (Sandbox Code Playgroud) 尝试检查并查看艺术家是否存在,如果没有添加或链接到foreignkey并保存.
这是模型
class Artist(models.Model):
"""Artist model"""
title = models.CharField(max_length=250, unique=True)
slug = models.SlugField(unique=True)
class Track(models.Model):
"""Track model"""
artist = models.ForeignKey(Artist)
title = models.CharField(max_length=250)
slug = models.SlugField(unique=True)
Run Code Online (Sandbox Code Playgroud)
这是检查的脚本
artist_id, created = Track.objects.get_or_create(artist_id=artist.title)
try:
artist_title = artist_id.artist_set.all()
except IndexError:
artist_slug = slugify(artist_title)
try:
artist = Artist.objects.create(title=artist_title, slug=artist_slug)
# artist.add(artist_id)
artist.save()
Run Code Online (Sandbox Code Playgroud)
我究竟做错了什么?
如何解码这样的unicode字符串:
什么%2527s%2bthe%2btime%252C%2bnow%253F
像这样的ascii:
什么+的+时间+现在