我试图在python中改进我的脚本的内存使用,因此我需要知道我的列表的RAM使用情况.我测量内存使用情况
print str(sys.getsizeof(my_list)/1024/1024)
Run Code Online (Sandbox Code Playgroud)
希望能给我一个Mb中RAM列表的大小.
它输出12 Mb,但是在top命令中我看到我的脚本在运行时使用了4G笔记本电脑的70%RAM.
此外,此列表应包含来自~500Mb文件的内容.
所以12Mb是不现实的.
如何衡量实际内存使用情况?
我在寻找可以使用语言模型的拼写检查器。
我知道有很多不错的拼写检查器,例如Hunspell,但是正如我所见,它与上下文无关,因此它仅基于令牌的拼写检查器。
例如,
I lick eating banana
因此,在基于令牌的级别上,根本没有拼写错误,所有单词都是正确的,但句子中没有意义。但是,“智能”拼写检查器会认识到“舔”实际上是正确书写的单词,但可能是作者的意思是“喜欢”,因此句子中有含义。
我在特定领域中有一堆正确书写的句子,我想训练“智能”拼写检查器以识别拼写错误并学习语言模型,以便它甚至可以认为“舔”被正确书写,但是作者的意思是“喜欢”。
我看不到Hunspell具有这种功能,您能建议其他任何拼写检查工具吗?
我有gnuplot的以下数据文件
1 0.5 0.9
2 -0.1 0.5
3 0.7 0.4
Run Code Online (Sandbox Code Playgroud)
其中第一列是x轴,2,3列是两个不同的图.x轴的坐标总是自然数,它们代表句子中单词的位置,2和3列只是句子中单词的函数结果.
我想知道是否可以在x轴上用句子中的单词标记"1","2",....
如果我愿意的话
1 A 0.5 0.9
2 green -0.1 0.5
3 apple 0.7 0.4
Run Code Online (Sandbox Code Playgroud)
然后代替1,2,3我会有"A""绿色""苹果".
如果可以使用gnuplot,请告诉我.
我想知道如何使用特定的weka实用程序.
对于exaple,我想使用以下实用程序TextDirectoryToArff.
我尝试按如下方式运行它
javac TextDirectoryToArff.java
TextDirectoryToArff.java:21: package weka.core does not exist
Run Code Online (Sandbox Code Playgroud)
并喜欢以下
java -jar /usr/share/java/weka-3.6.6.jar TextDirectoryToArff.java
Run Code Online (Sandbox Code Playgroud)
在这种情况下,weka启动而不是实用程序.
如何运行该实用程序.
我仍然是JavaScript的新手
我正在寻找一个简单的javascript循环,它对整数不感兴趣,并且对整数进行迭代。
在python中看起来像这样: for i in range(10)
在红宝石中: (1..10).each
我发现的javascript中最简单的示例是:
_.each(Array.apply(null, new Array(10)).map(Number.prototype.valueOf,0)
Run Code Online (Sandbox Code Playgroud)
您熟悉更简单的示例吗?