我在Ubuntu 13.10中安装了python(2.7.5)和python-nltk软件包.运行apt-cache policy python-nltk回报:
python-nltk:
Installed: 2.0~b9-0ubuntu4
Run Code Online (Sandbox Code Playgroud)
根据斯坦福大学的网站,2.0 +应该有stanford模块.然而,当我尝试导入它时,我收到一个错误:
>>> import nltk.tag.stanford
Traceback (most recent call last):
File "<stdin>", line 1, in <module>
ImportError: No module named stanford
Run Code Online (Sandbox Code Playgroud)
我如何获得stanford模块?(最好通过通常的存储库,因为我不喜欢在Ubuntu包管理器之外安装软件.)
我正在尝试使用matplotlib重建这个图表,或多或少:
除了我的中心是100,标准差是16(像智商).这是我到目前为止:
import numpy as np
import matplotlib.pyplot as plt
from scipy import stats as stats
x = np.linspace(50,150,100)
iq = stats.norm.pdf(x, 100, 16)
plt.plot(x,iq)
Run Code Online (Sandbox Code Playgroud)
这会生成如下的正常曲线:
到现在为止还挺好.但我对如何遮蔽曲线下的区域感到茫然.
我试图从plotlyhs中理解一个例子:
plotly "div6"
[points (aes & x .~ sepalLength
& y .~ sepalWidth
& color ?~ (fromEnum . irisClass)) iris]
& layout . margin ?~ thinMargins
& layout . height ?~ 300
Run Code Online (Sandbox Code Playgroud)
但我不知道是什么&意思.此外,我似乎无法谷歌它.
我也不知道是什么.~或?~意思,但我想我会问其他问题.
我正在探索用Elm替换XML-> XSLT-> HTML工作流的想法,只是为了看看我是否可以做到.我找到了一个Elm XML解析器,现在我只需要弄清楚如何将本地文件读入Elm.我似乎找不到任何解释如何做到这一点的东西.我该怎么做呢?
我对制图和Altair / Vega非常陌生。Altair文档中有一个示例,说明如何制作以美国各州的轮廓开始的地图,该地图的创建基本上是这样的:
states = alt.topo_feature(data.us_10m.url, feature='states')
# US states background
background = alt.Chart(states).mark_geoshape(
fill='lightgray',
stroke='white'
)
Run Code Online (Sandbox Code Playgroud)
但我想在不列颠群岛上绘制点。由于vega数据集中只有美国和世界地图,因此我必须创建自己的GeoJSON,不是吗?
因此,我尝试通过运行此博客文章中的一些命令行命令从世界地图上获取不列颠群岛的GeoJSON ,即,
ogr2ogr -f GeoJSON -where "adm0_a3 IN ('GBR','IRL','IMN','GGY','JEY','GBA')" subunits.json ne_10m_admin_0_map_subunits/ne_10m_admin_0_map_subunits.shp
Run Code Online (Sandbox Code Playgroud)
这似乎已经创建了一个GeoJSON文件subunits.json,它可能代表不列颠群岛。但是我怎样才能把它带入Altair?还是有其他方法可以使用Altair制作不列颠群岛的地图?
我只是想做一些类似于wget从 Internet 下载文件的操作。我看到曾经有一个名为http-wget的包,但它已被弃用,取而代之的是 http-conduit。
Http-conduit 有一个简单的例子来说明如何使用httpBS. 所以接下来,我得到了这个工作:
{-# LANGUAGE OverloadedStrings #-}
import Network.HTTP.Simple
import qualified Data.ByteString.Char8 as B8
main :: IO ()
main = do
let url = "https://www.example.com/sitemap.xml"
resp <- httpBS url
B8.putStrLn $ getResponseBody resp
Run Code Online (Sandbox Code Playgroud)
这适用于从 URL 获取文件名 (sitemap.xml):
{-# LANGUAGE OverloadedStrings #-}
import Network.HTTP.Simple
import qualified Data.ByteString.Char8 as B8
main :: IO ()
main = do
let url = "https://www.example.com/sitemap.xml"
let urlParts = B8.split '/' $ B8.pack url
let …Run Code Online (Sandbox Code Playgroud) 我有一个带有循环的python脚本,每次经常崩溃并有各种异常,需要重新启动.有没有办法在发生这种情况时运行一个动作,以便我可以收到通知?
这可以按5年组将我的数据分组:
dg = df.groupby((df.index//5)*5).mean()['matches-ratio']
dg.plot()
Run Code Online (Sandbox Code Playgroud)
这可以按性别对我的数据进行分组(一列):
dg = df.groupby(['gender'])['matches-ratio']
dg.plot()
Run Code Online (Sandbox Code Playgroud)
但我似乎无法按性别和5年年龄段进行分组。我已经尝试过类似的方法dg = df.groupby(['gender', (df.index//5)*5]).mean()['matches-ratio'],但这会产生奇怪的结果,其中日期按性别(???)和5年组进行分组,因此x轴标记为“性别,日期”。链接它们,如下所示:
dg = df.groupby(['gender'])['matches-ratio']
dg = dg.groupby((df.index//5)*5).mean()
dg.plot()
Run Code Online (Sandbox Code Playgroud)
给AttributeError: Cannot access callable attribute 'groupby' of 'SeriesGroupBy' objects, try using the 'apply' method。如何在不同的轴上分组两次?(日期= x轴,“匹配比率” = y轴)
我正在尝试使用 Python 设置开发环境,包括 Python 库 Spacy 和 Pandas。我试图运行的命令是nix-shell -p 'python36.withPackages(ps: with ps; [ spacy pandas ])'
但这就是发生的事情:
these derivations will be built:
/nix/store/7pgb52aa5hkgzv0mkc3jmxdhavxdr013-python3-3.6.6-env.drv
building '/nix/store/7pgb52aa5hkgzv0mkc3jmxdhavxdr013-python3-3.6.6-env.drv'...
collision between `/nix/store/k1njxvw8rdv29yz7iccr4nbfwcbghwhc-python3.6-msgpack-0.5.6/lib/python3.6/site-packages/msgpack/__pycache__/__init__.cpython-36.pyc' and `/nix/store/nig71x1wc7b3c04hs6vz8kk6bmdz5ldv-python3.6-msgpack-python-0.5.6/lib/python3.6/site-packages/msgpack/__pycache__/__init__.cpython-36.pyc'
Run Code Online (Sandbox Code Playgroud)
这里发生了什么,我该如何解决?
我刚刚制作了一个脚本,它从 TSV 文件中获取一些值并以不同的方式格式化它们。该脚本如下所示:
{-# LANGUAGE OverloadedStrings, QuasiQuotes #-}
import qualified Data.Text as T
import qualified Data.Text.IO as TIO
tsvToPat tsv = T.unlines $ map (makePat . (T.replace "-" " ") . head . (T.splitOn "\t")) (T.lines tsv)
main :: IO ()
main = do
pantone <- TIO.readFile "../data/maps/pantone/pantone.tsv"
xkcd <- TIO.readFile "../data/maps/xkcd/rgb.txt"
jaffer <- TIO.readFile "../data/maps/jaffer/master.tsv"
TIO.putStr $ tsvToPat pantone
TIO.putStr $ tsvToPat xkcd
TIO.putStr $ tsvToPat jaffer
makePat :: T.Text -> T.Text
makePat pat = T.concat [ "{\"label\":\"COLOR\",\"pattern\":[{\"lower\":\""
, …Run Code Online (Sandbox Code Playgroud)