小编Dud*_*ude的帖子

使用NLTK中的babelize_shell()进行机器翻译

嗨,我正在学习使用NLTK的自然语言处理.我正在尝试实现本书的babelize_shell()示例.我正在做的是执行babelize_shell(),之后我输入我的字符串,接着是书中所述的德语,然后是run.

我得到的错误是:

Traceback (most recent call last):
  File "<pyshell#148>", line 1, in <module>
    babelize_shell()
  File "C:\Python27\lib\site-packages\nltk\misc\babelfish.py", line 175, in babelize_shell
    for count, new_phrase in enumerate(babelize(phrase, 'english', language)):
  File "C:\Python27\lib\site-packages\nltk\misc\babelfish.py", line 126, in babelize
    phrase = translate(phrase, next, flip[next])
  File "C:\Python27\lib\site-packages\nltk\misc\babelfish.py", line 106, in translate
    if not match: raise BabelfishChangedError("Can't recognize translated string.")
BabelfishChangedError: Can't recognize translated string.
Run Code Online (Sandbox Code Playgroud)

这是一个示例会话:

>>> babelize_shell()
NLTK Babelizer: type 'help' for a list of commands.
Babel> how long before the next flight to Alice Springs?
Babel> …
Run Code Online (Sandbox Code Playgroud)

python nltk

2
推荐指数
1
解决办法
3475
查看次数

在SQL数据库中拥有多个索引的缺点?

我是一个数据库新手,我正在设计我的数据库.为了有效地操作我的应用程序,我需要在我的一半列上使用索引,因为我的外观将是对数时间.

但是在同一个表中有多个索引是否有任何缺点?

sql indexing

2
推荐指数
1
解决办法
3883
查看次数

在2D平面中的给定点集中找到两个点,其中最小距离小于O(n ^ 2)时间

我在雅虎被问到机器学习档案这个问题.给定一组点(x,y)坐标,我被要求找到O(n)或O(log n)时间内距离最小的点.显然我能够拿出O(n ^ 2)时间但是没有办法接近获得更好的算法.即使问题陈述是为分裂和征服而尖叫,我也无法想出合并步骤的原因.我也在互联网上搜索这个问题并发现它实际上非常受欢迎,但我仍然无法掌握合并步骤的推理.

任何人都可以帮我解决这个问题吗?

输入:(x1,y1),(x2,y2),(x3,y3),(x4,y4),(x5,y5)

algorithm performance time-complexity data-structures

1
推荐指数
1
解决办法
456
查看次数

使用大分数时要使用哪种数据类型?

我正在研究一个NLP项目,我应该计算这个表达式:

FREQ =345128分之1

我正在使用float和double,它正在读取0.0,这对我没有帮助,因为我想要确切的数字至少6位小数.

早些时候,当我这样做时,我只是将数字乘以10 ^ 6,因为我只是比较了两个值.但现在它有所不同,我需要确切的数字.有没有可用的工作我可以使用.

java floating-accuracy

1
推荐指数
1
解决办法
1438
查看次数

什么是非循环连接无向图?

我正在阅读最小生成树的讲座,它说我们应该在无向图中找到连通的非循环子图.

我的问题是,连接的无向图是如何成为非循环的,因为它是连接的,你可以从任何顶点移动到任何顶点.

谁能告诉我我做错了什么?

graph data-structures

1
推荐指数
1
解决办法
4705
查看次数

什么`#{*.inspection}`是什么意思?

我有一个问题puts #{parse_options.inspect}.parse_options是一个定义为的函数:

def parse_options
  options = {}
  case ARGV[1]
  when "-e"
    options[:e] = ARGV[2]
  when "-d"
    options[:d] = ARGV[2]
  end
  options
end
Run Code Online (Sandbox Code Playgroud)

它的输出是optionshashmap 的值.我想知道的inspect是应该如何工作.

ruby

-1
推荐指数
1
解决办法
216
查看次数

"*.txt"正则表达式如何与ls命令一起使用?

我有一个文件名

atxt

我正在运行此命令

ls*.txt

理想情况下它应该匹配.使用'a'和*为零字符,但它返回的文件如

a.txt,b.txt

为什么这里是ls治疗.作为字面点,比正则表达式的任何字符都要好.

regex unix shell ls

-1
推荐指数
1
解决办法
564
查看次数

N 个数字的乘积,答案错误,可能溢出?

我正在尝试解决“前 n 个数字的乘积”问题

   long ans=1;

    for(int i=1;i<=n;i++){
        ans = ans*i;
    }
    return ans % (1000000007) ;
Run Code Online (Sandbox Code Playgroud)

对于大 n,我的结果不正确,我怀疑可能溢出。我该如何解决它?

java algorithm overflow

-3
推荐指数
1
解决办法
91
查看次数