熊猫1.1.4
再次:
df = pd.DataFrame({"Code":[1,2], "view_A":[3000, 2300], "click_A":[3, 23],
"view_B":[1200, 300], "click_B":[5, 3]})
df.set_index("Code", inplace=True)
>>>
view_A click_A view_B click_B
Code
1 3000 3 1200 5
2 2300 23 300 3
Run Code Online (Sandbox Code Playgroud)
想把它打造成
view click
Code type
1 A 3000 3
2 A 2300 23
1 B 1200 5
2 B 300 3
Run Code Online (Sandbox Code Playgroud)
我可以做到,但想探索更多(干净)的选择。
我的索尔
a_df = df[["view_A", "click_A"]].rename(columns={"view_A":"view", "click_A":"click"})
a_df["type"] = "A"
b_df = df[["view_B", "click_B"]].rename(columns={"view_B":"view", "click_B":"click"})
b_df["type"] = "B"
final_df = pd.concat([a_df, b_df])
Run Code Online (Sandbox Code Playgroud)
但代码很脏。
在 Heroku 中创建存储库后,我想将我的项目从 master 分支推送到我的 heroku 存储库。
在我第一次尝试时,我收到以下错误消息:
无法检测到此应用的默认语言
搜索后,我使用了以下命令:
heroku buildpacks:set heroku/python
Run Code Online (Sandbox Code Playgroud)
现在它给了我这个错误信息:
应用程序与 buildpack 不兼容:https ://buildpack-registry.s3.amazonaws.com/buildpacks/heroku/python.tgz
所以现在我从一开始就尝试了一切,它给了我以下错误:
检测到 Python 应用
请求的运行时 ("python-3.7.1") 不适用于此堆栈 (heroku-18)。
我被困在这里。
我确实有一个requirements.txt包含所有要求runtime.txt的文件,并且与我的manage.py文件位于同一个文件夹中。
ubuntu 18.04、python3.8 并使用 pycharm。
pychamr 中的解释器路径设置正确。
在尝试读取 Excel 中的特定工作表时,使用 openpyxl 它不断给我带来 ImportError 。
ImportError: Missing optional dependency 'openpyxl'. Use pip or conda to install openpyxl.
我已经安装使用pip3 install openpyxl并且它说要求已经满足。但是,当我在 pycharm 中再次运行它时,它仍然输出相同的错误。
Requirement already satisfied: openpyxl mycomp/.local/lib/python3.8/site-packages (3.0.7)
Requirement already satisfied: et-xmlfile in mycomp/.local/lib/python3.8/site-packages (from openpyxl) (1.0.1)
Run Code Online (Sandbox Code Playgroud)
我的猜测是,因为我使用的是 venv,所以它没有在 venv 中正确安装,因为当我在安装时查看路径时,它不是 venv 所在的位置。
当我在 venv 上执行 pip3 freeze 并停用 venv 后,它看起来具有相同的安装。
这是 MRE:
data = [
{'1':20},
{'1':10},
{'1':40},
{'1':14},
{'1':33}
]
Run Code Online (Sandbox Code Playgroud)
我想要做的是遍历每个字典并将每个值附加到数据框中的列。
现在我正在做
import pandas as pd
lst = []
for item in data:
lst.append(item['1'])
df = pd.DataFrame({"col1":lst})
Run Code Online (Sandbox Code Playgroud)
输出:
col1
0 20
1 10
2 40
3 14
4 33
Run Code Online (Sandbox Code Playgroud)
是的,这就是我想要的,但是我的列表中有超过 100 万本词典。这是最有效的方法吗?
编辑:
pd.DataFrame(data).rename(columns={'1':'col1'})
适用于上述情况,但是如果数据看起来像这样怎么办?
data = [
{'1':
{'value':20}},
{'1':
{'value':10}},
{'1':
{'value':40}},
{'1':
{'value':14}},
{'1':
{'value':33}}]
Run Code Online (Sandbox Code Playgroud)
所以我会使用:
lst = []
for item in data:
lst.append(item['1']['value'])
df = pd.DataFrame({"col1":lst})
Run Code Online (Sandbox Code Playgroud)
包含字典的字典列表有更有效的方法吗?
将我的数据拟合成 X = 我的数据后
pca = PCA(n_components=1)
pca.fit(X)
X_pca = pca.fit_transform(X)
Run Code Online (Sandbox Code Playgroud)
现在 X_pca 有一个维度。
当我按照定义执行逆变换时,它不应该返回原始数据,即X,二维数组吗?
当我做
X_ori = pca.inverse_transform(X_pca)
Run Code Online (Sandbox Code Playgroud)
我得到相同的尺寸但不同的数字。
另外,如果我同时绘制 X 和 X_ori 它们是不同的。
使用Python 3.8,Plotly 4.13。
在我的散点图中,我使用add_vline()绘图中的方法添加了多条垂直线。但是,我无法将其添加到图例中,从而允许我打开/关闭垂直线。
如何在图例中添加垂直线?
这是我如何创建情节的示例:
fig = go.Figure()
fig.add_trace(
go.Scatter(name="name added to legend", datas...)
)
for dt in dates:
fig.add_vline(x=dt, line_width=1, etc...)
Run Code Online (Sandbox Code Playgroud)
输出类似这样的内容:
使用 创建的所有绘图go.Scatter都会添加到图例中,但不会添加到创建的垂直线fig.add_vline。
我正在努力建立自己的网站.1.我试图在页面中间的垂直方向创建链接; A,B,C,D然而它不作为链接工作,它就像一个段落.
我想让A,B,C,D在它们之间有空格.
有没有办法让A,B,C,D链接被圆圈覆盖?
/* navigation */
.navig {
float: left;
margin-top: 150px;
}
.navig a{
text-decoration: none;
color:black;
}
.navig a:hover{
}
.navig li{
list-style-type: none;
position: fixed;
padding-top: 50x;
line-height: 40px;
}Run Code Online (Sandbox Code Playgroud)
<div class="container">
<nav class="navig">
<ul>
<li><a href="http://google.com">A</a></li>
<li><a href="http://google.com">B</a></li>
<li><a href="http://google.com">C</a></li>
<li><a href="http://google.com">D</a></li>
</ul>
</nav>
Run Code Online (Sandbox Code Playgroud)
我正在使用 Kibana 7.1。
我已经成功创建了 Vega 线图。我可以允许它显示月份的数据,但是我希望用户在仪表板中使用时间过滤器,并允许 vega 可视化随之改变。
从https://www.elastic.co/blog/getting-started-with-vega-visualizations-in-kibana和 Vega 文档中我读到插入
"%context%": true,
"%timefield%": "@timestamp"
Run Code Online (Sandbox Code Playgroud)
内部网址将解决这个问题,但是当我这样做时,它给了我
url.%context% and url.%timefield% must not be used when url.body.query is set
我的完整的elasticsearch代码如下所示:
"data": {
"url": {
"%context%":"true",
"index": "access_log",
"body": {
"query": {
"bool": {
"must": [
{"term": {"request_1": "rent"}},
{"term": {"status": 200}}
]
}
},
"aggs": {
"histo": {
"date_histogram": {
"field": "date",
"interval": "day"
},
"aggs": {
"start_agg": {
"filter": {
"term": {"request_2": "start"}
}
},
"check_agg": {
"filter": { …Run Code Online (Sandbox Code Playgroud) 我有一本包含数据框的字典。
dictionary = {"key1": df1,
"key2": df2, and so on...}
Run Code Online (Sandbox Code Playgroud)
很少有 stackoverflow 帖子和 reddit 建议使用 Json 模块和 pickle 模块。
最有效的方法是什么?为什么?
当我将小字典转换为 pickle 时,它的内存小于 0kb 并呈现,这EOFError: Ran out of input在此处进行了解释为什么我在读取空文件时会收到“Pickle - EOFError:Ran out of input”?
有没有办法在训练逻辑回归时获得每次迭代的损失值?
Python sklearn 显示训练期间的损失值有一个 SGDRegressor 的工作示例,但不适用于逻辑回归。