import logging
import pandas as pd
logger = logging.getLogger('train')
logger.setLevel(logging.DEBUG)
# Data
data = {'Name': ['Tom', 'nick', 'krish', 'jack'], 'Age': [20, 21, 19, 18]}
# Create DataFrame
df = pd.DataFrame(data)
logger.info(type(df))
logger.info(df.info())
.
.
.
<other_processes>
.
Run Code Online (Sandbox Code Playgroud)
上面的代码输出:
<class 'pandas.core.frame.DataFrame'>
None
.
.
.
Run Code Online (Sandbox Code Playgroud)
在日志的末尾(在所有其他进程之后),它还输出:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 4 entries, 0 to 3
Data columns (total 2 columns):
Name 4 non-null object
Age 4 non-null int64
dtypes: int64(1), object(1)
memory usage: 144.0+ bytes
Run Code Online (Sandbox Code Playgroud)
None当我尝试记录 df.info() 时,为什么会打印它?如何在日志中的预期位置获取 df.info()?
我试图在训练使用keraswithtensorflow作为后端的深度学习模型时产生可重复的结果。
我浏览了这个文件:https : //keras.io/getting-started/faq/#how-can-i-obtain-reproducible-results-using-keras-during-development来设置 numpy 的、python 的和 tf 的随机种子train.py我用于训练的文件。
现在,这个文件从其他两个模块utils.py和model.py. 在这两个文件中,我都有import numpy as np和import tensorflow as tf在顶部。我的问题是 - 从不同模块导入和设置随机种子如何工作?
a) 我需要在导入语句后在每个文件中设置随机种子吗?
b) 或者,我是否只需要在 中设置这些种子train.py并在这些设置种子命令之后从其他模块执行所有导入?
c)tf.set_random_seed(1)以后import tensorflow as tf还需要做吗?
d)tf.set_random_seed(1)即使我不导入 tensorflow 或 keras 而只是从 keras 导入层,我是否需要设置?