小编Eli*_*Eli的帖子

Perl有哪些优秀的自然语言解析工具?

我听说Perl用于NLP很多,但我找不到几乎所有用于Perl的NLP工具.什么是好的Perl NLP工具/资源?Python有NLTK.Java有OpenNLP.Perl有类似的东西吗?

这确实是一个普遍的问题,但是如果有人也可以专门解决分块和POS标记,那就太棒了!

perl nlp

16
推荐指数
2
解决办法
3765
查看次数

Scripts目录是Python中的反模式吗?如果是这样,进口的正确方法是什么?

我总是在我构建的每个项目中创建脚本目录,因为它们对于不经常使用的可执行脚本非常有用.在Python中,我总是会__init__.py在我的脚本目录中放置一个脚本,因此我可以将脚本作为包运行(即python -m scripts.some_scripts)并从姐妹目录中加载模块.基于这个以及谷歌搜索,我开始觉得这是一个反模式.

那说,给定一个像这样的结构:

project_dir/
    some_modules_dir/
        foo.py
        bar.py
        ...
    scripts/
        some_script.py
        other_script.py
        ...
Run Code Online (Sandbox Code Playgroud)

什么是运行脚本的正确方法,以及从姐妹目录导入脚本的正确方法是some_modules_dir什么?应该包含哪些dirs __init__.py,哪些不应该包含哪些?我想尽可能地遵循PEP8,并希望尽可能简化运行脚本.如果拥有一个脚本目录本身就是不可取的,那么你们又做了什么呢?

python python-2.7

15
推荐指数
2
解决办法
567
查看次数

如何通过Docker连接到本地MySQL服务器?

对于如何通过Docker连接到本地服务,这是一个更普遍的问题.有在Github上的问题类似的问题在这里,似乎并未有任何决议.我真正想要的是能够在我的本地开发MySQL服务器上进行本地开发,然后在我准备部署之后,针对新创建的部署候选docker镜像进行本地测试.

理想情况下,两者都从同一个地方获取设置,所以我可以放mysql_server: host_ip.这似乎是一个典型的用例.目前有可能是这样的吗?

我正在使用Boot2Docker专门在我的主机mac的OS X Yosemite上运行的MySQL服务器不在容器中.尽管如此,为未来的读者提供更一般的答案会很酷.

docker

15
推荐指数
2
解决办法
3万
查看次数

Eclipse最好的Pig插件是什么?

我即将开始玩PIG-latin,我希望能在Eclipse中获得一些文本突出显示等等.快速进行谷歌搜索,我看到了几个Eclipse插件.它们还在发展中吗?哪个最好?

eclipse eclipse-plugin editor apache-pig

14
推荐指数
2
解决办法
1万
查看次数

有没有办法在Perl中获取一个匿名数组末尾的切片?

所以这让我在过去的半小时里疯狂了.有没有办法让我在一个匿名数组的末尾抓取一个数组切片?我已经尝试过了:

(split(' ',$test_line))[1..$#_]

我已经尝试过了, (split(' ',$test_line))[1..-1]

但是加剧了这些工作.我真的不希望有一个额外的临时变量实例化到中间数组(我不需要).我真的不想使用丑陋且难以理解的一个班轮(在网上找到一些).真的没有直接的方法来做到这一点吗?

perl

13
推荐指数
2
解决办法
4523
查看次数

仅允许通过ELB对AWS实例进行HTTP访问

我已经看到了一堆像类似的问题这一个,但没有给出一个笼统的回答.我是AWS的新手.我现在在我的VPC中运行了2个实例.我在他们面前有一个ELB设置,可以很好地将流量路由到两者.问题是,这两个实例目前也可以通过整个网络的HTTP来实现.我想改变一些事情,所以我的实例只能通过我的ELB点击HTTP.我怎样才能做到这一点?

amazon-ec2 amazon-web-services amazon-elb

13
推荐指数
1
解决办法
6587
查看次数

在SQLAlchemy Core中执行多个独立的语句?

我正在使用SQLAlchemy Core运行一些独立的语句.这些陈述是将表格分开并且不相关.因此,我不能使用标准table.insert()的多个字典传入.现在,我这样做:

sql_conn.execute(query1)
sql_conn.execute(query2)
Run Code Online (Sandbox Code Playgroud)

有什么方法可以一次性运行这些而不需要两次来回分配?我使用的是MySQL 5.7和Python 2.7.11.

python mysql sqlalchemy

13
推荐指数
1
解决办法
2195
查看次数

如何在Python和Perl中实现基本数据类型(字符串和整数)

我最近一直想知道我在字符串和整数等基本类型上执行的各种操作如何在性能方面起作用,我想如果我知道这些基本类型是如何实现的话我可以更好地理解这一点(即我已经听说字符串和整数在Python中是不可变的.这是否意味着修改字符串中一个字符的任何操作都是O(n),因为必须创建一个全新的字符串?如何添加数字?)

我对Python和Perl都很好奇,并且觉得两次基本相同的问题很傻,所以我只是把它包装成一个.

如果您可以在答案中包含一些示例操作成本,那么这将使其更有帮助.

python perl

12
推荐指数
2
解决办法
1374
查看次数

有没有办法匹配任何Unicode非字母字符?

我有一些文件经过OCR从PDF转换为HTML.因此,他们最终有很多随机的unicode标点,转换器搞砸了(即elipses等).他们也正确地拥有一堆非英语,但仍然是字母字符,如é和俄语字符等...

有没有办法制作一个匹配任何unicode字母字符(来自任何语言的字母)的正则表达式?或者只匹配非字母字符的那个?任何一个都会非常有用而且非常棒.我正在使用Perl,如果这改变了什么.谢谢!

regex unicode perl character-properties

11
推荐指数
1
解决办法
2万
查看次数

如何安装私有Python包作为构建的一部分

我有一个相当大的私有python包我刚刚完成创建.我想将它作为我在Docker容器中的应用程序的构建过程的一部分进行安装(尽管这不是那么重要).包源非常大,所以理想情况下我不会下载/保留整个源代码.

现在,我一直在和我的应用程序一起传递包源,但这是笨拙的,希望是暂时的.什么是更好的方式?git子模块/子树?我对此很陌生.

python pip git-submodules docker

11
推荐指数
3
解决办法
4976
查看次数