我试图在Windows上安装和使用Scrapy,我收到以下错误.
scrapy-pratice\scrapyenv\lib\site-packages\scrapy\utils\misc.py", line 42, in load_object
raise ImportError("Error loading object '%s': %s" % (path, e))
ImportError: Error loading object 'scrapy.core.downloader.handlers.s3.S3DownloadHandler': No module named win32api
Run Code Online (Sandbox Code Playgroud)
我已经从http://sourceforge.net/projects/pywin32/?source=typ_redirect下载并安装了基于我的python版本的正确的pywin32 .
版本和其他细节.我有一个python 2.7目录,其中包含Python和脚本
(C:\Python27)
pywin32-wininst.txt file (first few lines)
*** Installation started 2014/11/01 07:56 ***
Source: C:\Users\rajesh\Downloads\pywin32-219.win32-py2.7.exe
999 Root Key: HKEY_LOCAL_MACHINE
020 Reg DB Key: [Software\Microsoft\Windows\CurrentVersion\Uninstall]pywin32-py2.7
Run Code Online (Sandbox Code Playgroud)
这是我的python和Scrapy版本.
(scrapyenv) PS C:\Users\....\hackernews\hackernews> scrapy version -v
Scrapy : 0.24.4
lxml : 3.4.0.0
libxml2 : 2.9.0
Twisted : 14.0.2
Python : 2.7.4 (default, Apr 6 2013, 19:54:46) …Run Code Online (Sandbox Code Playgroud) 我在Hive上有几个表,我的查询试图检索过去x天的数据.当我使用直接日期时,Hive正在修剪分区,但是在使用公式时正在进行全表扫描.
select *
from f_event
where date_key > 20160101;
scanned partitions..
s3://...key=20160102 [f]
s3://...key=20160103 [f]
s3://...key=20160104 [f]
Run Code Online (Sandbox Code Playgroud)
如果我使用公式,比如说,获取过去4周的数据
Select count(*)
From f_event f
Where date_key > from_unixtime(unix_timestamp()-2*7*60*60*24, 'yyyyMMdd')
Run Code Online (Sandbox Code Playgroud)
这是扫描表中的所有分区.
环境:Hadoop 2.6.0,EMR,Hive on S3,Hive 1.0.0
请我有一个关于Gjango编程的问题。我想从Django表单中恢复数据以在views.py中使用它,但是我收到一个错误:缩进中的制表符和空格使用不一致(views.py,第21行)。我试图使用cleaned_data或request.POST我总是发现相同的错误,这是我的源代码:models.py
from django.db import models
# Create your models here.
class Personne(models.Model):
nom=models.CharField(max_length=200)
prenom=models.CharField(max_length=200)
def __unicode__(self):
return self.nom
def __str__(self):
return self.nom
Run Code Online (Sandbox Code Playgroud)
表格
from django import forms
from application1.models import Personne
class PersonneForm(forms.ModelForm):
class Meta:
model=Personne
#fields = '__all__'
fields=('nom','prenom')
Run Code Online (Sandbox Code Playgroud)
views.py
from django.shortcuts import render
from django.http import HttpResponseRedirect
from application1.forms import PersonneForm
def get_name(request):
# if this is a POST request we need to process the form data
if request.method == 'POST':
# create a form instance and populate …Run Code Online (Sandbox Code Playgroud) 我正在使用一个使用parse_args的简单脚本,但如果变量名是args,则赋值不起作用,如文档和多个示例所示.
(Pdb) parser.parse_args()
Namespace(partition_frequency='daily', start_date='2016-02-03', table_name='test_table')
(Pdb) x=parser.parse_args()
(Pdb) x
Namespace(partition_frequency='daily', start_date='2016-02-03', table_name='test_table')
(Pdb) args=parser.parse_args()
(Pdb) args
**>> No output**
(Pdb) arg=parser.parse_args()
(Pdb) arg
Namespace(partition_frequency='daily', start_date='2016-02-03', table_name='test_table')
Run Code Online (Sandbox Code Playgroud)
有线索吗?