我有以下脚本:
import pandas as pd
from igraph import *
df_p_c = pd.read_csv('data/edges.csv')
...
edges = list_edges
vertices = list(dict_case_to_number.keys())
g = Graph(edges=edges, directed=True)
plot(g, bbox=(6000, 6000))
Run Code Online (Sandbox Code Playgroud)
我有2300个边缘与稀有连接.这是我的情节:
以下是它的一些部分的缩放:
此图不可读,因为边之间的距离太小.如何在边缘之间留出更大的距离?只有来自同一"家庭"的边缘距离很小.
有没有其他方法来改善有很多边缘的情节?我正在寻找任何可视化父子关系的方法,它可能是另一个python包.
我在使用 summarytools 数据包时遇到问题。有教程:https : //cran.r-project.org/web/packages/summarytools/vignettes/Introduction.html带有漂亮的数据图:
我的问题是我的代码只生成TEXT GRAPH。这是我的 Markdown 中用于生成绘图的代码块:
```{r summary, results='markup'}
library(summarytools)
my_data <- ...
dfSummary(my_data)
```
Run Code Online (Sandbox Code Playgroud)
不幸的是,它会生成如下内容:
如何使用 summarytools 生成这个漂亮的报告?或者你有更好的工具吗?(生成图形、平均值、标准等)
我找到了生成绘图的正确语法:
print(dfSummary(baseline_train), method = 'render')
Run Code Online (Sandbox Code Playgroud)
我连接到远程数据库。为此,我正在使用 sshtunnel。我没有问题连接到数据库并访问数据。
我的问题是,我的脚本在所有操作之后都没有退出。我创建连接、下载数据、打印数据、停止 ssh 连接、打印“退出”。该脚本在 server.stop() 行停止工作并且不打印“停止”。我需要中断它以停止运行此代码。
这是代码:
from sshtunnel import SSHTunnelForwarder
from sqlalchemy import create_engine
import pandas as pd
server = SSHTunnelForwarder(
('host', 22),
ssh_password='password',
ssh_username='username',
remote_bind_address=('127.0.0.1', 3306)
)
server.start()
engine = create_engine(
'mysql+mysqldb://db_user:db_pass@127.0.0.1:{}/temps'.format(server.local_bind_port))
query = 'SELECT * FROM temp'
df = pd.read_sql(query, engine)
print(df.head())
print(df.tail())
server.stop()
print('stop')
Run Code Online (Sandbox Code Playgroud)
此脚本不打印“停止”。
问题:为什么这段代码不能停止工作?
我加了
trace_logger = create_logger(loglevel="TRACE")
在此之后,我注意到一些有趣的事情。带有数据传输的代码不包含一行:传输已关闭。我在没有发送 sql 查询的情况下检查了我的代码,脚本已正确完成。
2018-10-07 18:41:43,274| WAR | MainThrea/0967@sshtunnel | Could not read SSH configuration file: ~/.ssh/config
2018-10-07 18:41:43,275| INF | MainThrea/0993@sshtunnel | 0 …Run Code Online (Sandbox Code Playgroud) 我有一个带有DataTime列的数据框(时区的格式不同)。看来时区是UTC,但我想将列转换为pd.to_datetime,但失败了。那就是问题1。由于失败了,因此我无法在该时间段上执行任何datetime操作,例如按日期分组/确定日期/按小时分组等等。这是我的数据框df_res
DateTime
2017-11-02 19:49:28-07:00
2017-11-27 07:32:22-08:00
2017-12-27 17:01:15-08:00
Run Code Online (Sandbox Code Playgroud)
命令的输出
df_res["DateTime"] = df_res["DateTime"].dt.tz_convert('America/New_York')
Run Code Online (Sandbox Code Playgroud)
AttributeError: Can only use .dt accessor with datetimelike values
当我转换为 datetime
df_res['DateTime'] = pd.to_datetime(df_res['DateTime'])
Run Code Online (Sandbox Code Playgroud)
ValueError: Tz-aware datetime.datetime cannot be converted to datetime64 unless utc=True
我觉得我正在转圈。我需要将列转换为日期时间才能执行操作,并且为了做到这一点,我需要将它们全部设置为相同的时区,但除非具有日期时间对象,否则我就不能使用相同的时区,因此,如何最好地实现这一点。我确实提到了以前的帖子,但它们似乎尽可能容易地转换为日期时间:
将datetime列转换为其他时区pandas 将pandas时区感知的DateTimeIndex转换为朴素时间戳,但在特定时区
我有df列名:'a','b','c'......'z'.
print(my_df.columns)
Index(['a', 'b', 'c', ... 'y', 'z'],
dtype='object', name=0)
Run Code Online (Sandbox Code Playgroud)
我有功能,确定应显示哪些列.例如:
start = con_start()
stop = con_stop()
print(my_df.columns >= start) & (my_df <= stop)
Run Code Online (Sandbox Code Playgroud)
我的结果是:
[False False ... False False False False True True
True True False False]
Run Code Online (Sandbox Code Playgroud)
我的目标是仅显示满足我条件的列的数据框.如果start ='a'并且stop ='b',我希望:
0 a b
index1 index2
New York New York 0.000000 0.000000
California Los Angeles 207066.666667 214466.666667
Illinois Chicago 138400.000000 143633.333333
Pennsylvania Philadelphia 53000.000000 53633.333333
Arizona Phoenix 111833.333333 114366.666667
Run Code Online (Sandbox Code Playgroud) 我无法为一维输入向量构建 CNN。
输入值示例:
df_x.iloc[300]
Out[33]:
0 0.571429
1 1.000000
2 0.971429
3 0.800000
4 1.000000
5 0.142857
6 0.657143
7 0.857143
8 0.971429
9 0.000000
10 0.000000
11 0.000000
12 0.000000
13 0.000000
14 0.000000
15 0.000000
Name: 300, dtype: float64
Run Code Online (Sandbox Code Playgroud)
输出值示例:
df_y.iloc[300]
Out[34]:
0 0.571429
1 0.914286
2 1.000000
3 0.971429
4 0.800000
5 1.000000
6 0.914286
7 0.942857
8 0.800000
9 0.657143
10 0.857143
11 0.971429
12 0.000000
13 0.000000
14 0.000000
15 0.000000
16 0.000000
17 0.000000 …Run Code Online (Sandbox Code Playgroud) python machine-learning deep-learning conv-neural-network keras
python ×4
pandas ×3
python-3.x ×3
data-science ×1
datetime ×1
igraph ×1
keras ×1
matplotlib ×1
r ×1
ssh-tunnel ×1
summarytools ×1
timezone ×1