看来python3.5并没有完全释放任何已删除对象的内存,这可能是因为python内部维护某种memroy池以便重用目的,但是,我不想重用它们,我想让它们自由发挥内存可用于在linux上运行的其他程序.
>>> psutil.Process().memory_info().rss / 2**20
11.47265625
>>> d = {x:x for x in range(10**7)}
>>> psutil.Process().memory_info().rss / 2**20
897.1796875
>>> del d
>>> gc.collect()
0
>>> psutil.Process().memory_info().rss / 2**20
15.5859375
Run Code Online (Sandbox Code Playgroud)
这只是一个玩具示例,真正的问题是在正在运行的服务器上,占用20GB的不合适内存.
这是另一个例子:(wd1是带字符串键的dict的dict)
>>> psutil.Process().memory_info().rss / 2**20
28.1796875
>>> wd1 = {x:{i:i for i in d} for x in k}
>>> psutil.Process().memory_info().rss / 2**20
682.78125
>>> del wd1
>>> psutil.Process().memory_info().rss / 2**20
186.21484375
Run Code Online (Sandbox Code Playgroud) 我正在尝试将CSV文件中的数据读取到tensorflow,
官方文档中的示例代码如下:
col1, col2, col3, col4, col5 = tf.decode_csv(value, record_defaults=record_defaults)
Run Code Online (Sandbox Code Playgroud)
要读取文件,我需要事先知道文件中有多少列和行,如果有1000列,我需要定义1000个变量,col1, col2, col3, col4, col5,..., col1000 ,这看起来不像是一种有效的读取数据的方法.
我的问题
将CSV文件读入Tensorflow的最佳方法是什么?
有没有办法在Tensorflow中读取数据库(例如mongoDB)?
我的理解:SIFT描述符使用从16x16邻域像素计算的方向梯度的直方图.大图像中的16x16区域可以是非常小的区域,例如猫爪上的一根头发的1/10,当您将目标图像调整为小尺寸时,围绕相同关键点的16x16邻域可以是大部分的图像,例如猫的爪子使用SIFT描述符将原始图像与调整大小的图像进行比较是没有意义的,任何人都可以告诉我我的理解有什么问题吗?
在谷歌计算引擎上,我可以通过“本地主机”访问服务器上的端口,但我无法使用来自同一服务器或外部客户端机器的 IP 地址访问同一端口。我试图在 web 控制台页面上创建一个新的防火墙规则,并且可以从 Linux 命令看到它,但端口 8888 仍然无法访问
$ gcloud compute firewall-rules list
NAME NETWORK SRC_RANGES RULES SRC_TAGS TARGET_TAGS
allow8888 default 0.0.0.0/0 tcp:8888,udp:8888
default-allow-http default 0.0.0.0/0 tcp:80 http-server
default-allow-https default 0.0.0.0/0 tcp:443 https-server
Run Code Online (Sandbox Code Playgroud) 我训练了一个gensim.models.doc2vec.Doc2Vec模型
d2v_model = Doc2Vec(句子,大小= 100,window = 8,min_count = 5,workers = 4)我可以通过docvec = d2v_model.docvecs [0]获得文档向量
如何从训练有素的模型中获取单词向量?
我正在谷
歌云上运行一些 numpy dot 产品测试谷歌云计算引擎在执行 numpy.dot 操作时显示速度比具有较低 CPU 和内存规格的专用服务器慢 100 倍。
我正在考虑将我所有的系统转移到谷歌云,但这种糟糕的性能似乎是不可能的。有什么办法可以改善吗?
专用服务器规格:
- Intel Core i3 2120
- 16GB 内存
numpy.dot 时间:0.7363626956939697 秒
Google Cloud 计算引擎规范:
n1-highmem-8(8 个 vCPU,52 GB 内存)
numpy.dot 时间:92.44161581993103 秒
python ×2
cbir ×1
csv ×1
doc2vec ×1
gensim ×1
memory ×1
memory-leaks ×1
mongodb ×1
numpy ×1
python-3.x ×1
tensorflow ×1
word2vec ×1