我想从另一个url中获取数据,我正在使用urllib和Beautiful Soup,我的数据在table标签内(我已经使用Firefox控制台计算).但是当我尝试使用他的id获取表时结果是None,那么我想这个表必须通过一些js代码动态添加.
我已经尝试了所有解析器 'lxml','html5lib'但仍然无法获取该表数据.
我还尝试了一件事:
web = urllib.urlopen("my url")
html = web.read()
soup = BeautifulSoup(html, 'lxml')
js = soup.find("script")
ss = js.prettify()
print ss
Run Code Online (Sandbox Code Playgroud)
结果:
<script type="text/javascript">
myPage = 'ETFs';
sectionId = 'liQuotes'; //section tab
breadCrumbId = 'qQuotes'; //page
is_dartSite = "quotes";
is_dartZone = "news";
propVar = "ETFs";
</script>
Run Code Online (Sandbox Code Playgroud)
但现在我不知道如何获取这些js变量的数据.
现在我有两个选项要么获得表内容ot得到js变量,其中任何一个都可以完成我的任务但不幸的是我不知道如何获得这些,所以请告诉我如何解决任何一个问题.
谢谢
我试图在WordPress中运行Django,如主网址www.wptesting.com上的 WordPress 和郊区www.wptesting.com/django上的 Django .Django主根网址在www.wptesting.com/django正常工作, 但其郊区,例如,管理员无法工作,因为它应该是www.wptesting.com/django/admin.但是,每当我尝试请求管理员网址时,它都会转换为www.wptesting.comhttp%3a // wptesting.com/django/admin
我用Apache和运行WordPress和Django mod_wsgi,我的apache文件如下:
<VirtualHost *:80>
WSGIScriptAlias /django /path_to_project/wsgi.py
ServerName wptesting.com
ServerAlias www.wptesting.com
DocumentRoot /var/www/html/wordpress
<Directory /var/www/html/wordpress/>
AllowOverride All
Order allow,deny
allow from all
# Options Indexes FollowSymLinks
# Require all granted
</Directory>
<Directory /path_to_project/>
Options Indexes FollowSymLinks
Require all granted
</Directory>
</VirtualHost>
Run Code Online (Sandbox Code Playgroud)
我之前问了一个关于使用Apache和wsgi从WordPress的子目录配置Django 的问题 - > 你可以在这里看到问题
另外,如果我试图访问任何网址这是不是在Django项目则给予标准的404未找到错误,但是当我试图访问任何有效的URL如admin这是给上述错误不在话下.
编辑: 我的Urls.py文件:
from django.conf.urls import patterns, include, url
from django.contrib import admin
from django.views.generic import …Run Code Online (Sandbox Code Playgroud) 我想从db中获取最近12个月的数据,我已经为此写了一个查询但是只给了我数月而不是年份意味着与哪一年相关的月份.
我的Sql:
Select count(B.id),date_part('month',revision_timestamp) from package AS
A INNER JOIN package_revision AS B ON A.revision_id=B.revision_id
WHERE revision_timestamp > (current_date - INTERVAL '12 months')
GROUP BY date_part('month',revision_timestamp)
Run Code Online (Sandbox Code Playgroud)
它给了我这样的输出
month | count
-------+-------
7 | 21
8 | 4
9 | 10
Run Code Online (Sandbox Code Playgroud)
但是我想要像2012年7月一样的月份,或者在其他col的年份,并不重要
我有一个用户可以拥有多本书的场景。我可以为用户和书籍创建两个不同的模型,并使用外键将它们关联起来(或者一对多是正确的方式?)。我为用户模型创建了一个 Django 表单,但是当我在模板中喜欢这个{{form.as_p}} 时,只显示用户模型字段而不是书籍字段。
我希望用户字段也显示我提交的书籍模型(例如书名字段多次,因为他可以拥有多本书),请告诉我是否可以使用 django 表单/模型,或者我必须使用简单的 html 表单jquery,然后将数据保存在模型中。
谢谢
编辑: 我的模型:
class Product(models.Model):
categories = models.CharField(max_length=5, choices = settings.CATEGORIES)
name = models.CharField(max_length=100)
description = models.TextField()
currency = models.CharField(max_length=5, choices = settings.CURRENCY)
status = models.BooleanField(default=True)
def __unicode__(self):
return self.name
class Prices(models.Model):
products = models.ForeignKey(Product)
prices = models.IntegerField()
def __unicode__(self):
return self.id
Run Code Online (Sandbox Code Playgroud) 我想从电子邮件中删除所有特殊字符,例如“@”、“.” 并将它们替换为“下划线”,python“ unidecode ”中有一些函数,但它并不能完全满足我的要求。任何人都可以建议我某种方法,以便我可以在字符串中找到上述字符并将其替换为“下划线”。
谢谢。
我想使用 flask 创建文件夹。我谷歌了很多,但没有找到任何帮助。Evey 搜索向我展示了flask的文件夹结构,但我想知道如何使用代码创建文件夹。
实际上,我想在注册时为每个用户创建文件夹。所以建议我如何在烧瓶中的特定路径创建一个简单的空文件夹。
我在我的本地服务器上安装openerp,我已经安装了它和它的依赖,但在完成安装后我运行服务器'openerp-server'并使用0.0.0.0:8069/访问它.我收到以下错误
OpenERP Server Error
Client Traceback (most recent call last):
File "/usr/local/lib/python2.7/dist-packages/openerp-7.0_20130211_002141-py2.7.egg/openerp/addons/web/http.py", line 195, in dispatch
response["result"] = method(self, **self.params)
File "/usr/local/lib/python2.7/dist-packages/openerp-7.0_20130211_002141-py2.7.egg/openerp/addons/web/controllers/main.py", line 709, in get_list
return db_list(req)
File "/usr/local/lib/python2.7/dist-packages/openerp-7.0_20130211_002141-py2.7.egg/openerp/addons/web/controllers/main.py", line 88, in db_list
dbs = proxy.list()
File "/usr/local/lib/python2.7/dist-packages/openerp-7.0_20130211_002141-py2.7.egg/openerp/addons/web/session.py", line 31, in proxy_method
result = self.session.send(self.service_name, method, *args)
File "/usr/local/lib/python2.7/dist-packages/openerp-7.0_20130211_002141-py2.7.egg/openerp/addons/web/session.py", line 104, in send
raise xmlrpclib.Fault(openerp.tools.ustr(e), formatted_info)
Server Traceback (most recent call last):
File "/usr/local/lib/python2.7/dist-packages/openerp-7.0_20130211_002141-py2.7.egg/openerp/addons/web/session.py", line 90, in send
return openerp.netsvc.dispatch_rpc(service_name, method, args)
File "/usr/local/lib/python2.7/dist-packages/openerp-7.0_20130211_002141-py2.7.egg/openerp/netsvc.py", line …Run Code Online (Sandbox Code Playgroud) 可能重复:
检查用户是否处于脱机状态
我正在建立一个社区网站.用户将通常登录和注销.我使用在线/离线属性状态来设置用户的状态.但是如果用户只是单击X按钮或者在没有注销的情况下断开连接怎么办?它显示登录状态.我如何知道用户目前是否在线?
python ×6
django ×2
apache ×1
database ×1
django-forms ×1
django-urls ×1
flask ×1
javascript ×1
mod-wsgi ×1
mysql ×1
openerp ×1
php ×1
postgresql ×1
sql ×1
urllib2 ×1
web-scraping ×1
wordpress ×1