小编Mav*_*ick的帖子

Pandas 遍历 Excel 工作表并附加到 df

我正在尝试遍历 Excel 工作表并将多个工作表中的数据附加到数据框中。

到目前为止,我有:

master_df = pd.DataFrame()
for sheet in target_sheets:
    df1 = file.parse(sheet, skiprows=4) 
    master_df.append(df1, ignore_index=True)
Run Code Online (Sandbox Code Playgroud)

但是当我调用master_df.head()它返回时__

这些工作表上的数据格式相同并且相互关联。

所以我想像这样加入他们:

表 1 包含:

A1
B1
C1
Run Code Online (Sandbox Code Playgroud)

表 2 包含:

A2
B2
C2
Run Code Online (Sandbox Code Playgroud)

第 3 页:

A3
B3
C3
Run Code Online (Sandbox Code Playgroud)

最终结果:

A1
B1
C1
A2
B2
C2
A3
B3
C3
Run Code Online (Sandbox Code Playgroud)

我的逻辑是否正确或者我怎样才能做到这一点?

python python-3.x pandas

2
推荐指数
1
解决办法
5811
查看次数

点安装Scrappy-“ python setup.py egg_info”失败,错误代码为1

我正在尝试安装Scrappy。我已经安装了Python 3.6,并且在Windows上。

我已经试过了:

py -3.5-32 -m pip install Scrappy
Run Code Online (Sandbox Code Playgroud)

但是,得到以下内容:

Collecting Scrappy
  Using cached Scrappy-0.3.0.alpha.4.tar.gz
Collecting guessit (from Scrappy)
  Using cached guessit-2.1.2.tar.gz
Collecting tvdb_api (from Scrappy)
  Using cached tvdb_api-1.10.tar.gz
Collecting hachoir-metadata (from Scrappy)
  Using cached hachoir-metadata-1.3.3.tar.gz
    Complete output from command python setup.py egg_info:
    Traceback (most recent call last):
      File "<string>", line 1, in <module>
      File "C:\Users\USER~1.NAME\AppData\Local\Temp\pip-build-1tu2hkos\hachoir-metadata\setup.py", line 65
        except OSError, err:
                      ^
SyntaxError: invalid syntax

----------------------------------------   
Command "python setup.py egg_info" failed with error code 1 in C:\Users\USER~1.NAME\AppData\Local\Temp\pip-build-1tu2hkos\hachoir-metadata\
Run Code Online (Sandbox Code Playgroud)

是因为setuptools什么?因此,我对其进行了升级,然后尝试安装Scrappy,但收到了相同的错误消息。 …

python windows pip scrapy

1
推荐指数
1
解决办法
2405
查看次数

从第二组链接中抓取,抓取页面

我已经通过Scrapy文档今天一直在进行,并试图获得一个工作版本- https://docs.scrapy.org/en/latest/intro/tutorial.html#our-first-spider -在现实世界的例子。我的示例稍有不同,它有2个下一页,即

start_url>城市页面>单位页面

这是我要从中获取数据的单位页面。

我的代码:

import scrapy


class QuotesSpider(scrapy.Spider):
    name = "quotes"
    start_urls = [
        'http://www.unitestudents.com/',
            ]

    def parse(self, response):
        for quote in response.css('div.property-body'):
            yield {
                'name': quote.xpath('//span/a/text()').extract(),
                'type': quote.xpath('//div/h4/text()').extract(),
                'price_amens': quote.xpath('//div/p/text()').extract(),
                'distance_beds': quote.xpath('//li/p/text()').extract()
            }

            # Purpose is to crawl links of cities
            next_page = response.css('a.listing-item__link::attr(href)').extract_first()
            if next_page is not None:
                next_page = response.urljoin(next_page)
                yield scrapy.Request(next_page, callback=self.parse)

            # Purpose is to crawl links of units
            next_unit_page = response.css(response.css('a.text-highlight__inner::attr(href)').extract_first())
            if next_unit_page is not None:
                                          next_unit_page = response.urljoin(next_unit_page)
                                          yield scrapy.Request(next_unit_page, callback=self.parse) …
Run Code Online (Sandbox Code Playgroud)

python scrapy web-scraping

1
推荐指数
1
解决办法
2112
查看次数

升级到pip版本9.0.1

我在PyCharm上安装一些库时收到以下错误消息:

命令"python setup.py egg_info"失败,错误代码1在C:\ Users\user.name\AppData\Local\Temp\pycharm-packaging\hach​​oir-metadata \您正在使用pip版本8.1.1,但版本9.0. 1可用.您应该考虑通过'python -m pip install --upgrade pip'命令进行升级.

pip3.5.exe的路径:

C:\Users\user.name>AppData\Local\Programs\Python\Python35-32\Scripts\pip3.5.exe
Run Code Online (Sandbox Code Playgroud)

我从cmd运行了以下命令:

C:\Users\user.name>AppData\Local\Programs\Python\Python35-32\Scripts\pip3.5.exe install upgrade pip
Run Code Online (Sandbox Code Playgroud)

这给了我以下内容:

找不到满足要求升级的版本(从版本:)没有找到匹配的升级版本您正在使用pip版本8.1.1,但版本9.0.1可用.您应该考虑通过'python -m pip install --upgrade pip'命令进行升级.

然后我尝试了两个:

C:\Users\user.name>AppData\Local\Programs\Python\Python35-32\Scripts\pip.exe pip install upgrade pip
Run Code Online (Sandbox Code Playgroud)

和:

C:\Users\user.name>AppData\Local\Programs\Python\Python35-32\Scripts\pip.exe python -m pip install --upgrade pip
Run Code Online (Sandbox Code Playgroud)

从pip.exe(而不是pip3.5exe,因为它们不起作用)导致:

错误:未知命令

我很确定我在这里做错了什么,但不太清楚是什么?

尝试以下操作:
C:\ Users\user.name>\AppData\Local\Programs-m pip install --upgrade pip

C:\Users\user.name>\AppData\Local\Programs\Python\Python35-32\Scripts\pip.exe -m pip install --upgrade pip
C:\Users\user.name>\AppData\Local\Programs\Python -m pip install --upgrade pip
Run Code Online (Sandbox Code Playgroud)

python windows pip

-1
推荐指数
1
解决办法
2万
查看次数

标签 统计

python ×4

pip ×2

scrapy ×2

windows ×2

pandas ×1

python-3.x ×1

web-scraping ×1