小编Jon*_*han的帖子

我如何获得stanford NLTK python模块？

我在Ubuntu 13.10中安装了python(2.7.5)和python-nltk软件包.运行apt-cache policy python-nltk回报:

python-nltk:
  Installed: 2.0~b9-0ubuntu4

Run Code Online (Sandbox Code Playgroud)

根据斯坦福大学的网站,2.0 +应该有stanford模块.然而,当我尝试导入它时,我收到一个错误:

>>> import nltk.tag.stanford
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
ImportError: No module named stanford

Run Code Online (Sandbox Code Playgroud)

我如何获得stanford模块？(最好通过通常的存储库,因为我不喜欢在Ubuntu包管理器之外安装软件.)

python ubuntu nltk

Jon*_*han

lucky-day

4
推荐指数

1
解决办法

2239
查看次数

如何在matplotlib/pandas中的两条线之间的曲线下遮挡区域？

我正在尝试使用matplotlib重建这个图表,或多或少:

除了我的中心是100,标准差是16(像智商).这是我到目前为止:

import numpy as np
import matplotlib.pyplot as plt
from scipy import stats as stats
x = np.linspace(50,150,100)
iq = stats.norm.pdf(x, 100, 16)
plt.plot(x,iq)

Run Code Online (Sandbox Code Playgroud)

这会生成如下的正常曲线:

到现在为止还挺好.但我对如何遮蔽曲线下的区域感到茫然.

python matplotlib

Jon*_*han

lucky-day

4
推荐指数

1
解决办法

1932
查看次数

Haskell的含义是什么？

我试图从plotlyhs中理解一个例子:

plotly "div6"
    [points (aes & x .~ sepalLength 
                 & y .~ sepalWidth
                 & color ?~ (fromEnum . irisClass)) iris]
    & layout . margin ?~ thinMargins
    & layout . height ?~ 300

Run Code Online (Sandbox Code Playgroud)

但我不知道是什么&意思.此外,我似乎无法谷歌它.

我也不知道是什么.~或?~意思,但我想我会问其他问题.

haskell

Jon*_*han

lucky-day

4
推荐指数

1
解决办法

121
查看次数

如何在Elm中读取本地文件？

我正在探索用Elm替换XML-> XSLT-> HTML工作流的想法,只是为了看看我是否可以做到.我找到了一个Elm XML解析器,现在我只需要弄清楚如何将本地文件读入Elm.我似乎找不到任何解释如何做到这一点的东西.我该怎么做呢？

elm

Jon*_*han

lucky-day

4
推荐指数

1
解决办法

758
查看次数

如何在Altair中使用GeoJSON数据制作地图？

我对制图和Altair / Vega非常陌生。Altair文档中有一个示例，说明如何制作以美国各州的轮廓开始的地图，该地图的创建基本上是这样的：

states = alt.topo_feature(data.us_10m.url, feature='states')

# US states background
background = alt.Chart(states).mark_geoshape(
    fill='lightgray',
    stroke='white'
)

Run Code Online (Sandbox Code Playgroud)

但我想在不列颠群岛上绘制点。由于vega数据集中只有美国和世界地图，因此我必须创建自己的GeoJSON，不是吗？

因此，我尝试通过运行此博客文章中的一些命令行命令从世界地图上获取不列颠群岛的GeoJSON ，即，

ogr2ogr -f GeoJSON -where "adm0_a3 IN ('GBR','IRL','IMN','GGY','JEY','GBA')" subunits.json ne_10m_admin_0_map_subunits/ne_10m_admin_0_map_subunits.shp

Run Code Online (Sandbox Code Playgroud)

这似乎已经创建了一个GeoJSON文件subunits.json，它可能代表不列颠群岛。但是我怎样才能把它带入Altair？还是有其他方法可以使用Altair制作不列颠群岛的地图？

python geojson topojson vega altair

Jon*_*han

2019 05-04

4
推荐指数

1
解决办法

478
查看次数

如何使用 Haskell 从 Internet 下载文件？

我只是想做一些类似于wget从 Internet 下载文件的操作。我看到曾经有一个名为http-wget的包，但它已被弃用，取而代之的是 http-conduit。

Http-conduit 有一个简单的例子来说明如何使用httpBS. 所以接下来，我得到了这个工作：

{-# LANGUAGE OverloadedStrings #-}

import Network.HTTP.Simple
import qualified Data.ByteString.Char8 as B8

main :: IO ()
main = do
  let url = "https://www.example.com/sitemap.xml"
  resp <- httpBS url
  B8.putStrLn $ getResponseBody resp

Run Code Online (Sandbox Code Playgroud)

这适用于从 URL 获取文件名 (sitemap.xml)：

{-# LANGUAGE OverloadedStrings #-}

import Network.HTTP.Simple
import qualified Data.ByteString.Char8 as B8

main :: IO ()
main = do
  let url = "https://www.example.com/sitemap.xml"
  let urlParts = B8.split '/' $ B8.pack url
  let …

Run Code Online (Sandbox Code Playgroud)

haskell

Jon*_*han

2021 06-12

4
推荐指数

1
解决办法

111
查看次数

有没有办法让python程序在崩溃时运行一个动作？

我有一个带有循环的python脚本,每次经常崩溃并有各种异常,需要重新启动.有没有办法在发生这种情况时运行一个动作,以便我可以收到通知？

python

Jon*_*han

lucky-day

3
推荐指数

1
解决办法

205
查看次数

在熊猫中，如何在两个不同的轴上分组两次？

这可以按5年组将我的数据分组：

dg = df.groupby((df.index//5)*5).mean()['matches-ratio']
dg.plot()

Run Code Online (Sandbox Code Playgroud)

这可以按性别对我的数据进行分组（一列）：

dg = df.groupby(['gender'])['matches-ratio']
dg.plot()

Run Code Online (Sandbox Code Playgroud)

但我似乎无法按性别和5年年龄段进行分组。我已经尝试过类似的方法dg = df.groupby(['gender', (df.index//5)*5]).mean()['matches-ratio']，但这会产生奇怪的结果，其中日期按性别（???）和5年组进行分组，因此x轴标记为“性别，日期”。链接它们，如下所示：

dg = df.groupby(['gender'])['matches-ratio']
dg = dg.groupby((df.index//5)*5).mean()
dg.plot()

Run Code Online (Sandbox Code Playgroud)

给AttributeError: Cannot access callable attribute 'groupby' of 'SeriesGroupBy' objects, try using the 'apply' method。如何在不同的轴上分组两次？（日期= x轴，“匹配比率” = y轴）

python pandas

Jon*_*han

lucky-day

3
推荐指数

1
解决办法

2645
查看次数

在 NixOS 中，如何解决冲突？

我正在尝试使用 Python 设置开发环境，包括 Python 库 Spacy 和 Pandas。我试图运行的命令是nix-shell -p 'python36.withPackages(ps: with ps; [ spacy pandas ])'

但这就是发生的事情：

these derivations will be built:
  /nix/store/7pgb52aa5hkgzv0mkc3jmxdhavxdr013-python3-3.6.6-env.drv
building '/nix/store/7pgb52aa5hkgzv0mkc3jmxdhavxdr013-python3-3.6.6-env.drv'...
collision between `/nix/store/k1njxvw8rdv29yz7iccr4nbfwcbghwhc-python3.6-msgpack-0.5.6/lib/python3.6/site-packages/msgpack/__pycache__/__init__.cpython-36.pyc' and `/nix/store/nig71x1wc7b3c04hs6vz8kk6bmdz5ldv-python3.6-msgpack-python-0.5.6/lib/python3.6/site-packages/msgpack/__pycache__/__init__.cpython-36.pyc'

Run Code Online (Sandbox Code Playgroud)

这里发生了什么，我该如何解决？

python nix nixpkgs

Jon*_*han

2018 10-23

3
推荐指数

1
解决办法

1442
查看次数

如何在 Haskell 中重构这些 IO 操作？

我刚刚制作了一个脚本，它从 TSV 文件中获取一些值并以不同的方式格式化它们。该脚本如下所示：

{-# LANGUAGE OverloadedStrings, QuasiQuotes #-}

import qualified Data.Text as T
import qualified Data.Text.IO as TIO

tsvToPat tsv = T.unlines $ map (makePat . (T.replace "-" " ") . head . (T.splitOn "\t")) (T.lines tsv)

main :: IO ()
main = do
  pantone <- TIO.readFile "../data/maps/pantone/pantone.tsv"
  xkcd <- TIO.readFile "../data/maps/xkcd/rgb.txt"
  jaffer <- TIO.readFile "../data/maps/jaffer/master.tsv"
  TIO.putStr $ tsvToPat pantone
  TIO.putStr $ tsvToPat xkcd
  TIO.putStr $ tsvToPat jaffer


makePat :: T.Text -> T.Text
makePat pat = T.concat [ "{\"label\":\"COLOR\",\"pattern\":[{\"lower\":\""
                       , …

Run Code Online (Sandbox Code Playgroud)

haskell

Jon*_*han

2020 05-06

3
推荐指数

1
解决办法

67
查看次数