我正在用scrapy写一个蜘蛛,但是,我遇到了一些用js渲染的网站,因此urllib2.open_url不起作用.我发现我可以用webbrowser.open_new(url)打开浏览器,但是,我没有找到如何使用webbrowser获取页面的src代码.有什么办法可以用webbrowser来做这个,或者有没有其他解决方案没有webbrowser来处理js网站?
我正在使用南方的Django Web应用程序进行数据库迁移.我对南方很新,还有django.我尝试使用南方的官方教程,但它失败了一个例外:AttributeError:'Options'对象没有属性'index_together'.我像这样运行南命令:
python manage.py schemamigration southtut --initial
Run Code Online (Sandbox Code Playgroud)
southtut模型是这样的:
class Knight(models.Model):
name = models.CharField(max_length=100)
of_the_round_table = models.BooleanField()
Run Code Online (Sandbox Code Playgroud)
我的项目模型是这样的:
class Author(models.Model):
name = models.CharField(max_length=64)
authorId = models.CharField(max_length=32)
def __unicode__(self):
return self.name
class Meta:
db_table="Author"
class Video(models.Model):
videoId = models.CharField(max_length=32)
videoUrl = models.URLField(max_length=200)
author = models.ForeignKey(Author, null=True, related_name="videos", on_delete=models.SET_NULL)
class Meta:
db_table="Video"
class User(models.Model):
token = models.CharField(max_length=50, null=True)
favs = models.ManyToManyField(Video, related_name="fans", db_table="VideoUserR")
class Meta:
db_table = "User"
Run Code Online (Sandbox Code Playgroud)
我得到的整个错误信息如下:
Traceback (most recent call last):
File "manage.py", line 10, in <module>
execute_from_command_line(sys.argv) …Run Code Online (Sandbox Code Playgroud)