小编Cha*_*rat的帖子

大熊猫的大小和数量有什么区别?

这是熊猫groupby("x").countgroupby("x").size熊猫之间的区别?

尺寸只是排除零吗?

python numpy pandas difference

69
推荐指数
3
解决办法
2万
查看次数

将许多python pandas数据帧放到一个excel工作表中

只要是不同的工作表,就可以很容易地将许多pandas数据帧添加到excel工作簿中.但是,如果要使用pandas内置的df.to_excel功能,将许多数据帧放入一个工作表中有点棘手.

# Creating Excel Writer Object from Pandas  
writer = pd.ExcelWriter('test.xlsx',engine='xlsxwriter')   
workbook=writer.book
worksheet=workbook.add_worksheet('Validation') 
df.to_excel(writer,sheet_name='Validation',startrow=0 , startcol=0)   
another_df.to_excel(writer,sheet_name='Validation',startrow=20, startcol=0) 
Run Code Online (Sandbox Code Playgroud)

上面的代码不起作用.你会得到错误的

 Sheetname 'Validation', with case ignored, is already in use.
Run Code Online (Sandbox Code Playgroud)

现在,我已经进行了足够的实验,我发现了一种方法可以使它工作.

writer = pd.ExcelWriter('test.xlsx',engine='xlsxwriter')   # Creating Excel Writer Object from Pandas  
workbook=writer.book
df.to_excel(writer,sheet_name='Validation',startrow=0 , startcol=0)   
another_df.to_excel(writer,sheet_name='Validation',startrow=20, startcol=0) 
Run Code Online (Sandbox Code Playgroud)

这会奏效.所以,我在stackoverflow上发布这个问题的目的是双重的.首先,我希望如果他/她试图将许多数据帧放在excel的单个工作表中,这将有助于某人.

其次,有人可以帮助我理解这两个代码块之间的区别吗?在我看来它们几乎是相同的,除了第一块代码创建的工作表提前称为"验证"而第二块没有.我得到那个部分.

我不明白的是为什么它会有所不同?即使我没有提前创建工作表,这一行,就在最后一行之前,

 df.to_excel(writer,sheet_name='Validation',startrow=0 , startcol=0)  
Run Code Online (Sandbox Code Playgroud)

无论如何都会创建一个工作表.因此,当我们到达最后一行代码时,工作表"验证"也已在第二个代码块中创建.那么,基本上我的问题是,为什么第二个代码块工作而第一个代码块没有?

如果有其他方法可以使用内置的df.to_excel功能将许多数据帧放入excel,请分享!

python excel dataframe pandas xlsxwriter

39
推荐指数
4
解决办法
3万
查看次数

调试keras张量值

我正在实现自己的keras损失功能.如何访问张量值?

我试过的

def loss_fn(y_true, y_pred):
    print y_true
Run Code Online (Sandbox Code Playgroud)

它打印

Tensor("target:0", shape=(?, ?), dtype=float32)
Run Code Online (Sandbox Code Playgroud)

是否有任何keras函数来访问y_true值?

python neural-network keras tensor

25
推荐指数
2
解决办法
2万
查看次数

如何修复PlotlyRequestError?

我执行代码时得到'PlotlyRequestError:No message'.

import plotly
import plotly.plotly as py
import plotly.graph_objs as go

Filedata = pd.read_csv('C:\\Documents\\Book4.csv')
data = [go.Scatter(x=Filedata.ix[:,0],y=Filedata.ix[:,1])]
layout = go.Layout(
title='Analysis 2016',
xaxis=dict(title='Startdate'),
yaxis=dict(title='Conductivity'))

fig = go.Figure(data=data, layout=layout)
py.iplot(fig)
Run Code Online (Sandbox Code Playgroud)

python plotly

8
推荐指数
2
解决办法
4756
查看次数

AttributeError:类型对象“Word2Vec”没有属性“load_word2vec_format”

我正在尝试实现 word2vec 模型并收到属性错误

AttributeError:类型对象“Word2Vec”没有属性“load_word2vec_format”

下面是代码:

wv = Word2Vec.load_word2vec_format("GoogleNews-vectors-negative300.bin.gz", binary=True)
wv.init_sims(replace=True)
Run Code Online (Sandbox Code Playgroud)

请让我知道这个问题?

python nlp gensim word2vec

7
推荐指数
1
解决办法
2万
查看次数

Python3错误"ImportError:没有名为的模块"有__init__.py

我创建了一个简单的烧瓶应用程序,我的目录结构如下所示:

myproject
- src
-- models
--- __init__.py
-- views
--- errors.py
--- default.py
-- application.py
-- config.py
-- __init__.py
- test
-- test_myproject.py
Readme.md
setup.py
..
Run Code Online (Sandbox Code Playgroud)

来自src 的application.py看起来像这样:

from src.models import db
from src.views.errors import error_pages
from src.views.scoreboard import scoreboard
from src.config import config
Run Code Online (Sandbox Code Playgroud)

test_myproject看起来是这样的:

from src.models import db, Result
from src.application import create_app
Run Code Online (Sandbox Code Playgroud)

我使用Pycharm来开发它,当我点击运行它工作,但当我尝试通过命令行运行它时,python application.py我得到以下错误:

Traceback (most recent call last):
  File "src/application.py", line 18, in <module>
    from src.models import db
ImportError: No …
Run Code Online (Sandbox Code Playgroud)

python unit-testing directory-structure importerror flask

6
推荐指数
1
解决办法
4526
查看次数

检查列表中是否存在字典

我有一个包含一些dicts的列表:

dict1 = {
'key1': 'value1',
'key2': 'value2',
}

dict2 = {
'key1': 'value3',
'key2': 'value4',
}

list = [dict1, dict2]
Run Code Online (Sandbox Code Playgroud)

我用它来检查列表中是否存在dict,例如我改为dict1

dict1 = {
'key1': 'something',
'key2': 'value2',
}
Run Code Online (Sandbox Code Playgroud)

现在,检查 dict1

if dict1 in list:
    print('Exists')
else:
    print('Not exists')
Run Code Online (Sandbox Code Playgroud)

它必须返回'Not exists',但事实并非如此.

python dictionary list python-3.x

6
推荐指数
2
解决办法
1万
查看次数

直接在Azure Datalake中将Python Dataframe写入CSV文件

我已将一个excel文件导入到pandas数据框中,并已完成数据浏览和清理过程。

我现在想将已清理的数据帧写到csv文件中,再回到Azure DataLake,而不必先将其保存为本地文件。我正在使用熊猫3。

我的代码如下所示:

token = lib.auth(tenant_id = '', 
                 client_secret ='', 
                 client_id = '')

adl = core.AzureDLFileSystem(token, store_name)

with adl.open(path='Raw/Gold/Myfile.csv', mode='wb') as f:
    **in_xls.to_csv(f, encoding='utf-8')**
    f.close()
Run Code Online (Sandbox Code Playgroud)

我在粗体语句中得到以下转储。

TypeError:需要一个类似字节的对象,而不是'str'

我也尝试过但没有运气

with adl.open(path='Raw/Gold/Myfile.csv', mode='wb') as f:
    with io.BytesIO(in_xls) as byte_buf:
        byte_buf.to_csv(f, encoding='utf-8')
        f.close()
Run Code Online (Sandbox Code Playgroud)

我收到以下错误:

TypeError:需要一个类似字节的对象,而不是“ DataFrame”

任何想法/技巧将不胜感激

python azure-data-lake

5
推荐指数
1
解决办法
3346
查看次数

对 Selenium 使用随机 userAgent (python)

需要使用随机用户代理。我的代码是:

#!/usr/bin/python
# Import selenium
from selenium import webdriver

# init Profile options for navigation
fp = webdriver.FirefoxProfile()

# Set userAgent
fp.set_preference("general.useragent.override", "custom userAgent")
fp.update_preferences()
Run Code Online (Sandbox Code Playgroud)

python selenium user-agent automated-tests selenium-firefoxdriver

5
推荐指数
1
解决办法
2609
查看次数

Matplotlib 线宽基于轴,而不是点

如果在 Matplotlib 中设置线宽,则必须以磅为单位给出线宽。就我而言,我有两个圆,半径均为 R,我想用一条线将它们连接起来。我希望这条线是 2*R 宽以获得棒状。但是当我说myLines[i].set_linewidth(2*R)这会使线条始终具有特定的粗细,无论我放大了多少。

有没有办法使线条具有特定的粗细,而不是基于像素或点的数量,而是随轴缩放?如何使我的线条与圆圈的直径具有相同的宽度?

我希望我能很好地解释自己,我期待着答案。

python plot matplotlib line

5
推荐指数
2
解决办法
2183
查看次数