小编Adi*_*rji的帖子

在Vim中更改变量名称

我试图通过Vim读取很多C/Perl代码,其中包含许多单字母变量名.

在我阅读代码的过程中,有一些命令可以帮助我将变量的名称更改为更有意义的内容,这样我就可以更快地阅读其余内容.

在Vim中是否有一些命令可以让我快速执行此操作?

我不认为正则表达式会起作用,因为:

  1. 相同的单个字母名称在不同的作用域块中可能具有不同的用途

  2. 相同的字母组合可以是另一个较大的var名称的一部分,或者在字符串或注释中......不想修改它们

任何已知的方案?

variables vim refactoring

88
推荐指数
4
解决办法
3万
查看次数

在Ruby中将空字符串转换为nil

我有一个被调用的字符串word和一个调用的函数infinitive,它
word.infinitive会在某些情况下返回另一个字符串而空字符串,否则
我试图为下面的代码片段找到一个优雅的ruby一行表达式

if word.infinitive == ""
      return word
else return word.infinitive
Run Code Online (Sandbox Code Playgroud)

如果不定式返回nil而不是"",我本可以做类似的事情

(word.infinitive or word)
Run Code Online (Sandbox Code Playgroud)

但由于它没有,我不能利用短路或者
理想情况下我想要
1)单个表达式,我可以很容易地嵌入其他代码
2)函数不定式只被调用一次
3)不添加任何自定义宝石或插件到我的代码中

ruby string boolean

23
推荐指数
5
解决办法
2万
查看次数

检查某些东西是否已被malloced

给定一个变量的指针..有没有办法检查它是静态还是动态分配?

c malloc

8
推荐指数
1
解决办法
2535
查看次数

使用宝石而不安装它

我需要运行一堆我在服务器上编写的ruby脚本,我没有sudo访问权限.
在我自己的机器上,我使用'sudo gem install ..'安装了一堆宝石并在我的代码中使用它们.
有没有任何机制可以让我使用这些宝石而不正式安装它们在远程机器上?

ruby rubygems

8
推荐指数
1
解决办法
4134
查看次数

命名实体识别与解析之间的区别?

命名实体识别和命名实体解析之间有什么区别?会欣赏一个实际的例子.

nlp named-entity-recognition named-entity-extraction

8
推荐指数
1
解决办法
2376
查看次数

Ngram IDF 平滑

我正在尝试使用 IDF 分数在我庞大的文档语料库中找到有趣的短语。
我基本上需要像亚马逊的 Statistically Improbable Phrases 之类的东西,即区分文档与所有其他文档的短语
我遇到的问题是我的数据中的一些 (3,4)-grams 具有超高的 idf 实际上由组件组成具有非常低 idf 的 unigrams 和 bigrams ..
例如,“你从未尝试过”具有非常高的 idf,而每个组件 unigrams 的 idf 都非常低 ..
我需要想出一个可以接收的函数n-gram 及其所有组件 (nk)-gram 的文档频率,并返回一个更有意义的度量,以衡量该短语将父文档与其他文档区分开的程度。
如果我要处理概率,我会尝试插值或退避模型。我不确定这些模型利用哪些假设/直觉来表现良好,以及它们对 IDF 分数的表现如何。
有人有更好的想法吗?

nlp information-retrieval machine-learning tf-idf

4
推荐指数
1
解决办法
1888
查看次数

Wikipedia Scraper使用Python

嗨,我正在尝试构建一个简单的维基百科报废工具,可以让我分析文本,并使用python在一个人的生活中构建事件的时间表.我在网上搜索可能的方法,直到现在我已经能够使用BeautifulSoup和urllib2检索数据.到现在为止的代码看起来像这样:

from bs4 import  BeautifulSoup
import urllib2
import re
import nltk
import json


#get source code of page (function used later)
def fetchsource(url):
    source = urllib2.urlopen(url).read()
    return source

if __name__=='__main__':
    #url = "http://en.wikipedia.org/w/index.php?action=raw&title=Tom_Cruise" #works
    url="http://en.wikipedia.org/w/api.php?action=query&prop=revisions&rvprop=content&format=xml&&titles=Tom_Cruise" #works
    print url
    source = fetchsource(url)
    soup = BeautifulSoup(source)
    print soup.prettify()
Run Code Online (Sandbox Code Playgroud)

现在虽然我可以使用它,但我得到的输出有点难以解析,我只是想问是否有更好的方法或可能更可管理的语法,我可以检索数据.请评论.

python nlp wikipedia urllib2 beautifulsoup

3
推荐指数
1
解决办法
3318
查看次数

使fscanf忽略可选参数

我正在使用fscanf读取一个文件,其中包含
数字<-whitespace-> string <-whitespace-> optional_3rd_column

我希望从每列中提取数字和字符串,但如果存在则忽略3rd_column

示例数据:
12 foo something
03 bar
24 something #randomcomment

我想提取12,foo; 03,酒吧; 24,忽略"某事"和"#randomcomment"的东西

我现在有类似的东西

while(scanf("%d %s %*s",&num,&word)>=2)
{ 
assign stuff 
}
Run Code Online (Sandbox Code Playgroud)

但是,对于没有第3列的行,这不起作用.如何在第二个字符串后忽略所有内容?

c scanf

2
推荐指数
1
解决办法
1万
查看次数

按平均值筛选SQL

我有两个表产品和评论
每个产品有几个评论由评论表中的
外键product_id链接另外每个评论都有一个名为评级的字段十进制值
我希望得到所有平均评级高于a的产品的名称某些阈值的
某些内容

SELECT p.name
FROM products p
INNER JOIN reviews r ON p.id = r.product_id
WHERE avg(r.rating) > 3
Run Code Online (Sandbox Code Playgroud)

MySQL不允许我在where子句中使用avg函数.
我该怎么办?

sql

0
推荐指数
1
解决办法
1085
查看次数