我正在尝试遍历 Excel 工作表并将多个工作表中的数据附加到数据框中。
到目前为止,我有:
master_df = pd.DataFrame()
for sheet in target_sheets:
df1 = file.parse(sheet, skiprows=4)
master_df.append(df1, ignore_index=True)
Run Code Online (Sandbox Code Playgroud)
但是当我调用master_df.head()它返回时__
这些工作表上的数据格式相同并且相互关联。
所以我想像这样加入他们:
表 1 包含:
A1
B1
C1
Run Code Online (Sandbox Code Playgroud)
表 2 包含:
A2
B2
C2
Run Code Online (Sandbox Code Playgroud)
第 3 页:
A3
B3
C3
Run Code Online (Sandbox Code Playgroud)
最终结果:
A1
B1
C1
A2
B2
C2
A3
B3
C3
Run Code Online (Sandbox Code Playgroud)
我的逻辑是否正确或者我怎样才能做到这一点?
我正在尝试安装Scrappy。我已经安装了Python 3.6,并且在Windows上。
我已经试过了:
py -3.5-32 -m pip install Scrappy
Run Code Online (Sandbox Code Playgroud)
但是,得到以下内容:
Collecting Scrappy
Using cached Scrappy-0.3.0.alpha.4.tar.gz
Collecting guessit (from Scrappy)
Using cached guessit-2.1.2.tar.gz
Collecting tvdb_api (from Scrappy)
Using cached tvdb_api-1.10.tar.gz
Collecting hachoir-metadata (from Scrappy)
Using cached hachoir-metadata-1.3.3.tar.gz
Complete output from command python setup.py egg_info:
Traceback (most recent call last):
File "<string>", line 1, in <module>
File "C:\Users\USER~1.NAME\AppData\Local\Temp\pip-build-1tu2hkos\hachoir-metadata\setup.py", line 65
except OSError, err:
^
SyntaxError: invalid syntax
----------------------------------------
Command "python setup.py egg_info" failed with error code 1 in C:\Users\USER~1.NAME\AppData\Local\Temp\pip-build-1tu2hkos\hachoir-metadata\
Run Code Online (Sandbox Code Playgroud)
是因为setuptools什么?因此,我对其进行了升级,然后尝试安装Scrappy,但收到了相同的错误消息。 …
我已经通过Scrapy文档今天一直在进行,并试图获得一个工作版本- https://docs.scrapy.org/en/latest/intro/tutorial.html#our-first-spider -在现实世界的例子。我的示例稍有不同,它有2个下一页,即
start_url>城市页面>单位页面
这是我要从中获取数据的单位页面。
我的代码:
import scrapy
class QuotesSpider(scrapy.Spider):
name = "quotes"
start_urls = [
'http://www.unitestudents.com/',
]
def parse(self, response):
for quote in response.css('div.property-body'):
yield {
'name': quote.xpath('//span/a/text()').extract(),
'type': quote.xpath('//div/h4/text()').extract(),
'price_amens': quote.xpath('//div/p/text()').extract(),
'distance_beds': quote.xpath('//li/p/text()').extract()
}
# Purpose is to crawl links of cities
next_page = response.css('a.listing-item__link::attr(href)').extract_first()
if next_page is not None:
next_page = response.urljoin(next_page)
yield scrapy.Request(next_page, callback=self.parse)
# Purpose is to crawl links of units
next_unit_page = response.css(response.css('a.text-highlight__inner::attr(href)').extract_first())
if next_unit_page is not None:
next_unit_page = response.urljoin(next_unit_page)
yield scrapy.Request(next_unit_page, callback=self.parse) …Run Code Online (Sandbox Code Playgroud) 我在PyCharm上安装一些库时收到以下错误消息:
命令"python setup.py egg_info"失败,错误代码1在C:\ Users\user.name\AppData\Local\Temp\pycharm-packaging\hachoir-metadata \您正在使用pip版本8.1.1,但版本9.0. 1可用.您应该考虑通过'python -m pip install --upgrade pip'命令进行升级.
pip3.5.exe的路径:
C:\Users\user.name>AppData\Local\Programs\Python\Python35-32\Scripts\pip3.5.exe
Run Code Online (Sandbox Code Playgroud)
我从cmd运行了以下命令:
C:\Users\user.name>AppData\Local\Programs\Python\Python35-32\Scripts\pip3.5.exe install upgrade pip
Run Code Online (Sandbox Code Playgroud)
这给了我以下内容:
找不到满足要求升级的版本(从版本:)没有找到匹配的升级版本您正在使用pip版本8.1.1,但版本9.0.1可用.您应该考虑通过'python -m pip install --upgrade pip'命令进行升级.
然后我尝试了两个:
C:\Users\user.name>AppData\Local\Programs\Python\Python35-32\Scripts\pip.exe pip install upgrade pip
Run Code Online (Sandbox Code Playgroud)
和:
C:\Users\user.name>AppData\Local\Programs\Python\Python35-32\Scripts\pip.exe python -m pip install --upgrade pip
Run Code Online (Sandbox Code Playgroud)
从pip.exe(而不是pip3.5exe,因为它们不起作用)导致:
错误:未知命令
我很确定我在这里做错了什么,但不太清楚是什么?
尝试以下操作:
C:\ Users\user.name>\AppData\Local\Programs-m pip install --upgrade pip
C:\Users\user.name>\AppData\Local\Programs\Python\Python35-32\Scripts\pip.exe -m pip install --upgrade pip
C:\Users\user.name>\AppData\Local\Programs\Python -m pip install --upgrade pip
Run Code Online (Sandbox Code Playgroud)