小编Mat*_*s12的帖子

如何在绘图破折号中更改图像大小

如何更改图像大小？我已经使用下面的代码行插入我的图像，但我似乎无法弄清楚你是如何让它变小的

html.Div(html.Img(src=app.get_asset_url('logo.png')))

Run Code Online (Sandbox Code Playgroud)

我试过了：

html.Div(html.Img(src=app.get_asset_url('logo.png')),style={'height':'10%'})

Run Code Online (Sandbox Code Playgroud)

有什么建议

python dashboard image python-3.x plotly-dash

Mat*_*s12

lucky-day

7
推荐指数

1
解决办法

1万
查看次数

如何在 anaconda 中安装 Snowflake.sqlalchemy？

我正在尝试用 Python 连接到雪花。目前我还没有成功。我读过有关使用引擎方式的论坛，即：

url = URL(
    account = 'xxxx',
    user = 'xxxx',
    password = 'xxxx',
    database = 'xxx',
    schema = 'xxxx',
    warehouse = 'xxx',
    role='xxxxx',
    authenticator='https://xxxxx.okta.com',
)
engine = create_engine(url)


connection = engine.connect()

query = '''
select * from MYDB.MYSCHEMA.MYTABLE
LIMIT 10;
'''

df = pd.read_sql(query, connection)

Run Code Online (Sandbox Code Playgroud)

但我收到错误：

ModuleNotFoundError: No module named 'snowflake.sqlalchemy'

Run Code Online (Sandbox Code Playgroud)

如何在 Anaconda 中安装此模块？我找不到如何解决这个问题，我读过的任何其他方式都行不通。

anaconda snowflake-cloud-data-platform

Mat*_*s12

2023 04-13

3
推荐指数

1
解决办法

2万
查看次数

我如何绘制来自熊猫的 k 均值聚类？

我正在尝试对来自不同公司的产品销售的数据进行聚类。请注意，我将列中的任何字符串映射到数值，以便我可以使用 k 均值聚类。我有以下代码，我在我的数据上做 k-means

FeaturesDf=FeaturesDf[['company_value','Date_value','product_value']]
# Convert DataFrame to matrix
mat = FeaturesDf.values
#Using sklearn
km = sklearn.cluster.KMeans(n_clusters=5)
km.fit(mat)
# Get cluster assignment labels
labels = km.labels_
# Format results as a DataFrame
results = pd.DataFrame(data=labels, columns=['cluster'], index=orderFeaturesDf.index)

Run Code Online (Sandbox Code Playgroud)

我如何绘制一个 k 均值聚类图？我试过

plt.scatter(results.index,results['cluster'], c='black')
plt.plot(results)

Run Code Online (Sandbox Code Playgroud)

但是有没有更好的方法来做到这一点？

python k-means pandas data-science

Mat*_*s12

lucky-day

2
推荐指数

1
解决办法

4059
查看次数

如何使用多列熊猫删除异常值？

在我的整个数据框中，我有两列价格和数量。这些都包含异常值。如何删除这两列中的异常值，以便返回的数据帧排除这些列中的异常值？我可以将其应用于一列，但不确定如何将其应用于两列。

我已经尝试过以下方法

def make_mask(df, column):
    standardized = (df[column] - df[column].mean())/df[column].std()
    return standardized.abs() >= 2

def filter_outliers(df, columns):
    print(columns)
    masks = (make_mask(df, column) for column in columns)
    print(masks)
    full_mask = np.logical_or.reduce(masks)
    print(full_mask)
    return df[full_mask]

outliersremoved_df=filter_outliers(df,['price','qty'])

Run Code Online (Sandbox Code Playgroud)

我已经使用了这个，但我一次只能将其应用于一列：

def remove_outlier(df_in, col_name):
    q1 = df_in[col_name].quantile(0.25)
    q3 = df_in[col_name].quantile(0.75)
    iqr = q3-q1 #Interquartile range
    fence_low  = q1-1.5*iqr
    fence_high = q3+1.5*iqr
    df_out = df_in.loc[(df_in[col_name] > fence_low) & (df_in[col_name] < fence_high)]
    return df_out

Run Code Online (Sandbox Code Playgroud)

前 2 个函数出现错误：

ValueError: too many values to unpack (expected 1)

Run Code Online (Sandbox Code Playgroud)

outliers dataframe python-3.x pandas

Mat*_*s12

lucky-day

1
推荐指数

1
解决办法

1万
查看次数

如何将 pandas 中的数据拆分到指定的存储桶中，例如 40-40-20？

全部，

我试图将我的数据分成 3 个部分，即 40%、40% 和 20%。我怎样才能使用熊猫做到这一点？例如，这样你就可以得到底部最低的 40%、中间 40% 和顶部 20% ：

pd.cut(df['count'], 5,labels = ['1','2','3','4','5'],retbins=True)

Run Code Online (Sandbox Code Playgroud)

上面分为 5 个五分位数，但我想定义 40:40:20 百分位数。

有任何想法吗？

python statistics binning pandas

Mat*_*s12

lucky-day

1
推荐指数

1
解决办法

1万
查看次数

如何获得 pandas 中每一行的前 3 个最小值和前 3 个最高值？

我有一个如下表：

group    shopspend  clothspend  foodspend music spend

A          1              2        12       34
B          1              2        12       34
C          1              2        12       34
d          1              2        12       34

Run Code Online (Sandbox Code Playgroud)

在我的原始框架中，我有更多的列。我如何返回（对于每个组，按行）每行前 3 个最低值和前 3 个最高值，并返回相应的列值？注意：group是一个索引：

df = df.set_index('group') 

df.apply(lambda x: df.columns[np.argsort(x)], 1).iloc(axis=0)[:, :3]

Run Code Online (Sandbox Code Playgroud)

上面尝试过，但它说 IndexingError: Too much Indexers.. 不确定如何获得每行的最高列和前 3 个最低列。

dataframe python-3.x pandas

Mat*_*s12

2021 07-06

0
推荐指数

1
解决办法

661
查看次数

标签统计

pandas ×4

python ×3

python-3.x ×3

dataframe ×2

anaconda ×1

binning ×1

dashboard ×1

data-science ×1

image ×1

k-means ×1

outliers ×1

plotly-dash ×1

snowflake-cloud-data-platform ×1

statistics ×1

如何在绘图破折号中更改图像大小

如何在 anaconda 中安装 Snowflake.sqlalchemy？

我如何绘制来自熊猫的 k 均值聚类？

如何使用多列熊猫删除异常值？

如何将 pandas 中的数据拆分到指定的存储桶中，例如 40-40-20？

如何获得 pandas 中每一行的前 3 个最小值和前 3 个最高值？

标签 统计

小编Mat_s12的帖子

标签统计