如何更改图像大小?我已经使用下面的代码行插入我的图像,但我似乎无法弄清楚你是如何让它变小的
html.Div(html.Img(src=app.get_asset_url('logo.png')))
Run Code Online (Sandbox Code Playgroud)
我试过了:
html.Div(html.Img(src=app.get_asset_url('logo.png')),style={'height':'10%'})
Run Code Online (Sandbox Code Playgroud)
有什么建议
我正在尝试用 Python 连接到雪花。目前我还没有成功。我读过有关使用引擎方式的论坛,即:
url = URL(
account = 'xxxx',
user = 'xxxx',
password = 'xxxx',
database = 'xxx',
schema = 'xxxx',
warehouse = 'xxx',
role='xxxxx',
authenticator='https://xxxxx.okta.com',
)
engine = create_engine(url)
connection = engine.connect()
query = '''
select * from MYDB.MYSCHEMA.MYTABLE
LIMIT 10;
'''
df = pd.read_sql(query, connection)
Run Code Online (Sandbox Code Playgroud)
但我收到错误:
ModuleNotFoundError: No module named 'snowflake.sqlalchemy'
Run Code Online (Sandbox Code Playgroud)
如何在 Anaconda 中安装此模块?我找不到如何解决这个问题,我读过的任何其他方式都行不通。
我正在尝试对来自不同公司的产品销售的数据进行聚类。请注意,我将列中的任何字符串映射到数值,以便我可以使用 k 均值聚类。我有以下代码,我在我的数据上做 k-means
FeaturesDf=FeaturesDf[['company_value','Date_value','product_value']]
# Convert DataFrame to matrix
mat = FeaturesDf.values
#Using sklearn
km = sklearn.cluster.KMeans(n_clusters=5)
km.fit(mat)
# Get cluster assignment labels
labels = km.labels_
# Format results as a DataFrame
results = pd.DataFrame(data=labels, columns=['cluster'], index=orderFeaturesDf.index)
Run Code Online (Sandbox Code Playgroud)
我如何绘制一个 k 均值聚类图?我试过
plt.scatter(results.index,results['cluster'], c='black')
plt.plot(results)
Run Code Online (Sandbox Code Playgroud)
但是有没有更好的方法来做到这一点?
在我的整个数据框中,我有两列价格和数量。这些都包含异常值。如何删除这两列中的异常值,以便返回的数据帧排除这些列中的异常值?我可以将其应用于一列,但不确定如何将其应用于两列。
我已经尝试过以下方法
def make_mask(df, column):
standardized = (df[column] - df[column].mean())/df[column].std()
return standardized.abs() >= 2
def filter_outliers(df, columns):
print(columns)
masks = (make_mask(df, column) for column in columns)
print(masks)
full_mask = np.logical_or.reduce(masks)
print(full_mask)
return df[full_mask]
outliersremoved_df=filter_outliers(df,['price','qty'])
Run Code Online (Sandbox Code Playgroud)
我已经使用了这个,但我一次只能将其应用于一列:
def remove_outlier(df_in, col_name):
q1 = df_in[col_name].quantile(0.25)
q3 = df_in[col_name].quantile(0.75)
iqr = q3-q1 #Interquartile range
fence_low = q1-1.5*iqr
fence_high = q3+1.5*iqr
df_out = df_in.loc[(df_in[col_name] > fence_low) & (df_in[col_name] < fence_high)]
return df_out
Run Code Online (Sandbox Code Playgroud)
前 2 个函数出现错误:
ValueError: too many values to unpack (expected 1)
Run Code Online (Sandbox Code Playgroud) 全部,
我试图将我的数据分成 3 个部分,即 40%、40% 和 20%。我怎样才能使用熊猫做到这一点?例如,这样你就可以得到底部最低的 40%、中间 40% 和顶部 20% :
pd.cut(df['count'], 5,labels = ['1','2','3','4','5'],retbins=True)
Run Code Online (Sandbox Code Playgroud)
上面分为 5 个五分位数,但我想定义 40:40:20 百分位数。
有任何想法吗?
我有一个如下表:
group shopspend clothspend foodspend music spend
A 1 2 12 34
B 1 2 12 34
C 1 2 12 34
d 1 2 12 34
Run Code Online (Sandbox Code Playgroud)
在我的原始框架中,我有更多的列。我如何返回(对于每个组,按行)每行前 3 个最低值和前 3 个最高值,并返回相应的列值?注意:group是一个索引:
df = df.set_index('group')
df.apply(lambda x: df.columns[np.argsort(x)], 1).iloc(axis=0)[:, :3]
Run Code Online (Sandbox Code Playgroud)
上面尝试过,但它说 IndexingError: Too much Indexers.. 不确定如何获得每行的最高列和前 3 个最低列。
pandas ×4
python ×3
python-3.x ×3
dataframe ×2
anaconda ×1
binning ×1
dashboard ×1
data-science ×1
image ×1
k-means ×1
outliers ×1
plotly-dash ×1
snowflake-cloud-data-platform ×1
statistics ×1