小编Mat*_*s12的帖子

如何在绘图破折号中更改图像大小

如何更改图像大小?我已经使用下面的代码行插入我的图像,但我似乎无法弄清楚你是如何让它变小的

html.Div(html.Img(src=app.get_asset_url('logo.png')))
Run Code Online (Sandbox Code Playgroud)

我试过了:

html.Div(html.Img(src=app.get_asset_url('logo.png')),style={'height':'10%'})
Run Code Online (Sandbox Code Playgroud)

有什么建议

python dashboard image python-3.x plotly-dash

7
推荐指数
1
解决办法
1万
查看次数

如何在 anaconda 中安装 Snowflake.sqlalchemy?

我正在尝试用 Python 连接到雪花。目前我还没有成功。我读过有关使用引擎方式的论坛,即:

url = URL(
    account = 'xxxx',
    user = 'xxxx',
    password = 'xxxx',
    database = 'xxx',
    schema = 'xxxx',
    warehouse = 'xxx',
    role='xxxxx',
    authenticator='https://xxxxx.okta.com',
)
engine = create_engine(url)


connection = engine.connect()

query = '''
select * from MYDB.MYSCHEMA.MYTABLE
LIMIT 10;
'''

df = pd.read_sql(query, connection)
Run Code Online (Sandbox Code Playgroud)

但我收到错误:

ModuleNotFoundError: No module named 'snowflake.sqlalchemy'
Run Code Online (Sandbox Code Playgroud)

如何在 Anaconda 中安装此模块?我找不到如何解决这个问题,我读过的任何其他方式都行不通。

anaconda snowflake-cloud-data-platform

3
推荐指数
1
解决办法
2万
查看次数

我如何绘制来自熊猫的 k 均值聚类?

我正在尝试对来自不同公司的产品销售的数据进行聚类。请注意,我将列中的任何字符串映射到数值,以便我可以使用 k 均值聚类。我有以下代码,我在我的数据上做 k-means

FeaturesDf=FeaturesDf[['company_value','Date_value','product_value']]
# Convert DataFrame to matrix
mat = FeaturesDf.values
#Using sklearn
km = sklearn.cluster.KMeans(n_clusters=5)
km.fit(mat)
# Get cluster assignment labels
labels = km.labels_
# Format results as a DataFrame
results = pd.DataFrame(data=labels, columns=['cluster'], index=orderFeaturesDf.index)
Run Code Online (Sandbox Code Playgroud)

我如何绘制一个 k 均值聚类图?我试过

plt.scatter(results.index,results['cluster'], c='black')
plt.plot(results)
Run Code Online (Sandbox Code Playgroud)

但是有没有更好的方法来做到这一点?

python k-means pandas data-science

2
推荐指数
1
解决办法
4059
查看次数

如何使用多列熊猫删除异常值?

在我的整个数据框中,我有两列价格和数量。这些都包含异常值。如何删除这两列中的异常值,以便返回的数据帧排除这些列中的异常值?我可以将其应用于一列,但不确定如何将其应用于两列。

我已经尝试过以下方法

def make_mask(df, column):
    standardized = (df[column] - df[column].mean())/df[column].std()
    return standardized.abs() >= 2

def filter_outliers(df, columns):
    print(columns)
    masks = (make_mask(df, column) for column in columns)
    print(masks)
    full_mask = np.logical_or.reduce(masks)
    print(full_mask)
    return df[full_mask]

outliersremoved_df=filter_outliers(df,['price','qty']) 
Run Code Online (Sandbox Code Playgroud)

我已经使用了这个,但我一次只能将其应用于一列:

def remove_outlier(df_in, col_name):
    q1 = df_in[col_name].quantile(0.25)
    q3 = df_in[col_name].quantile(0.75)
    iqr = q3-q1 #Interquartile range
    fence_low  = q1-1.5*iqr
    fence_high = q3+1.5*iqr
    df_out = df_in.loc[(df_in[col_name] > fence_low) & (df_in[col_name] < fence_high)]
    return df_out
Run Code Online (Sandbox Code Playgroud)

前 2 个函数出现错误:

ValueError: too many values to unpack (expected 1)
Run Code Online (Sandbox Code Playgroud)

outliers dataframe python-3.x pandas

1
推荐指数
1
解决办法
1万
查看次数

如何将 pandas 中的数据拆分到指定的存储桶中,例如 40-40-20?

全部,

我试图将我的数据分成 3 个部分,即 40%、40% 和 20%。我怎样才能使用熊猫做到这一点?例如,这样你就可以得到底部最低的 40%、中间 40% 和顶部 20% :

pd.cut(df['count'], 5,labels = ['1','2','3','4','5'],retbins=True)
Run Code Online (Sandbox Code Playgroud)

上面分为 5 个五分位数,但我想定义 40:40:20 百分位数。

有任何想法吗?

python statistics binning pandas

1
推荐指数
1
解决办法
1万
查看次数

如何获得 pandas 中每一行的前 3 个最小值和前 3 个最高值?

我有一个如下表:

group    shopspend  clothspend  foodspend music spend

A          1              2        12       34
B          1              2        12       34
C          1              2        12       34
d          1              2        12       34
Run Code Online (Sandbox Code Playgroud)

在我的原始框架中,我有更多的列。我如何返回(对于每个组,按行)每行前 3 个最低值和前 3 个最高值,并返回相应的列值?注意:group是一个索引:

df = df.set_index('group') 

df.apply(lambda x: df.columns[np.argsort(x)], 1).iloc(axis=0)[:, :3]
Run Code Online (Sandbox Code Playgroud)

上面尝试过,但它说 IndexingError: Too much Indexers.. 不确定如何获得每行的最高列和前 3 个最低列。

dataframe python-3.x pandas

0
推荐指数
1
解决办法
661
查看次数