小编Ran*_*Ran的帖子

Python中Twitter的情感分析

我正在寻找文本情感分析(http://en.wikipedia.org/wiki/Sentiment_analysis)的开源实现,最好是在python中.是否有人熟悉我可以使用的这种开源实现?

我正在编写一个应用程序,在Twitter上搜索一些搜索词,比如"youtube",并计算"快乐"的推文与"悲伤"的推文.我正在使用Google的appengine,所以它在python中.我希望能够从twitter中对返回的搜索结果进行分类,我想在python中进行分类.到目前为止,我还没有找到这样的情绪分析器,特别是在python中.您熟悉我可以使用的这种开源实现吗?最好这已经是python,但如果没有,希望我可以将它翻译成python.

请注意,我正在分析的文本非常简短,它们是推文.理想情况下,此分类器针对此类短文本进行了优化.

顺便说一下,twitter确实支持搜索中的":)"和":("运算符,其目的就是为了做到这一点,但不幸的是,他们提供的分类并不是那么好,所以我想我可能会试一试.

谢谢!

BTW,早期的演示就在这里,我到目前为止的代码就在这里,我很乐意与任何感兴趣的开发人员一起开源.

python open-source nlp machine-learning sentiment-analysis

86
推荐指数
5
解决办法
5万
查看次数

如何在Maven中按类别运行JUnit测试?

使用JUnit 4.8和新@Category注释,有没有办法选择与Maven的Surefire插件一起运行的类别子集?

例如,我有:

@Test
public void a() {
}

@Category(SlowTests.class)
@Test
public void b() {
}
Run Code Online (Sandbox Code Playgroud)

我想按照以下方式运行所有非慢速测试:(注意-Dtest.categories由我组成......).

mvn test -Dtest.categories=!SlowTests // run non-slow tests
mvn test -Dtest.categories=SlowTests // run only slow tests
mvn test -Dtest.categories=SlowTests,FastTests // run only slow tests and fast tests
mvn test // run all tests, including non-categorized
Run Code Online (Sandbox Code Playgroud)

所以重点是我不想创建测试套件(Maven只是在项目中选择了非常方便的所有单元测试)并且我希望Maven能够按类别选择测试.我想我刚编了-Dtest.categories,所以我想知道是否有类似的设施我可以使用?

java junit categories maven maven-surefire-plugin

70
推荐指数
6
解决办法
5万
查看次数

故事板是否适用于ios 4?

故事板是xcode 4.2中的新功能,简化了导航设计.
我假设使用故事板的新应用程序在iOS 5发布时会正常运行,但我还没有看到任何关于故事板与iOS 4的兼容性.
它是有意义的,它们可以工作(就像ARC应该会去工作 - 它们是编译器/ IDE功能,而不是运行时功能AFAIK)但这只是我猜测,是否有人知道使用故事板是否安全并且能够为iOS 4发货?

谢谢!

storyboard ios

30
推荐指数
1
解决办法
9423
查看次数

可扩展的http会话管理(java,linux)

是否有可扩展的http会话管理的最佳实践?

问题空间:

  • 购物车的一种用例.网站周围的用户商店,最终退房; 会话必须保留.
  • 多个数据中心
  • 每个数据中心都有多个Web服务器
  • Java,linux

我知道有很多方法可以做到这一点,我总能想出我自己的具体解决方案,但我想知道stackoverflow的人群智慧是否可以帮助我专注于最佳实践

一般来说,似乎有一些方法:

  • 不要保持会议; 总是运行无国籍,虔诚[对我不起作用......]
  • 使用j2ee,ejb和该团伙的其他成员
  • 使用数据库来存储会话.我想有一些工具可以让它更容易,所以我不需要自己制作
  • 使用memcached存储会话(或其他类型的中间,半持久存储)
  • 使用键值DB.比memcached"更持久"
  • 使用"客户端会话",意味着所有会话信息都存在于隐藏的表单字段中,并从客户端传递到服务器.服务器上没有存储任何内容.

有什么建议?谢谢

java linux session scalability http

16
推荐指数
2
解决办法
7356
查看次数

Ant依赖管理

似乎蚂蚁依赖管理至少可以说不好......但是,有希望吗?今天有更好的构建或项目管理选择,如maven,常春藤,但我坚持使用一堆依赖于彼此的蚂蚁项目,所以我想知道是否有一个"蚂蚁最佳实践"来管理依赖项.

特别是在我的情况下,我有:

w.war

a.jar
b.jar
c.jar
Run Code Online (Sandbox Code Playgroud)

w.war是我部署到Web服务器的war文件.在war文件中我使用a.jar.a.jar依赖于b.jar,所以我很乐意将b.jar包装成w ...这样就好了......直到b.jar依赖于c.jar时才会出现问题.a.jar的作者知道它对b.jar的依赖性,因此它可以将b.jar打包到w.war中,但它不知道b.jar对c.jar的依赖性.此外,b.jar的作者以后可以添加更多依赖项,例如"b.jar依赖于e.jar",因此a.jar的作者在他们加起来时没有机会跟随这些依赖项.

我想要的是定义"a取决于b"和"b取决于c"(在不同的build.xml文件中)并使用ant magic将它们全部编译成w.war.那可能吗?如果没有,是否有最佳实践?

我就是这个 - 只是重写只是在maven中,但这是很多工作......对蚂蚁有希望吗?

ant

13
推荐指数
1
解决办法
2万
查看次数

Java图形库

我正在寻找一个高级java图形库,用于创建艺术文本,水印,调整大小,裁剪,图像识别和操作.ImageMagic是这种库的一个很好的例子,但是它的java端口有些问题(它们要么通过JNI运行imagemagic,要么通过命令行运行,并且很难部署到服务器).理想情况下,我希望具有与ImageMagic类似的功能,但纯Java和开源,可免费使用.有没有人见过这样的东西?

这适用于服务器端组件.一种服务,可以处理各种Web格式(png,jpg,gif等)的图像.

Java有自己的库,当然(Graphics2D)但我正在寻找更高级别的东西.

以下是几个用例:

  • 调整图像大小并裁剪图像.如果它具有"智能调整大小"或"智能裁剪",那将是很酷的,例如缝合雕刻调整大小,或通过照片中的兴趣点裁剪
  • 在图像上绘制艺术文本.使用字体,颜色,文字效果(三维文字,木炭和其他效果)
  • 嵌入水印.
  • 分层图像,使用图像作为背景,屏蔽图像等.
  • 图像识别,如 - 颜色数,stdev等.

如前所述,其Graphics2D中的Java支持上述所有内容,但是级别太低,所以我正在寻找一些更好用的东西.

谢谢!

java graphics image-manipulation

12
推荐指数
1
解决办法
9336
查看次数

Ruby on Rails,Paperclip,Heroku,GitHub和AWS - 保护密钥

我正在使用Heroku托管的RoR,我想使用paperclip在s3上存储文件.我的源代码托管在github上,并且具有全局可读性.将密钥与世界其他地方保密的最佳做法是什么?
Paperclip建议访问密钥存储在配置文件中(或代码中),例如我有:

file:config/s3.yml

access_key_id: my_access_key_id
secret_access_key: my_very_secret_key
bucket: bucket_name
Run Code Online (Sandbox Code Playgroud)

Heroku通过将代码提交给本地git然后将其推送到Heroku来工作.因为我也在使用github,所以我也将相同的代码推送到github.这意味着我也在那里推出了密钥.
我目前正在使用世界上可读的github帐户,所以如果我支付github,我可以解决一半的问题,但我仍然不满意代码中配置文件中的密钥.我不知道是否有更好的做法.

保持密钥保密并仍然使用上面提到的库和服务列表的最佳做法是什么?

顺便说一下,我上周才开始使用ror和heroku,所以我可能会被认为是新手,请体谅;)谢谢!

ruby-on-rails github heroku amazon-s3 paperclip

12
推荐指数
1
解决办法
1991
查看次数

iOS定时后台处理

我希望我的应用程序能够 - 比如每12个小时 - 即使应用程序没有正常运行或在后台运行,向服务器发送HTTP请求,获取带有版本号的小文件,如果服务器上的版本高于客户端上的版本,然后将更多文件下载到磁盘,以便下次启动应用程序时,它将在磁盘上找到新内容.

哪些设计模式最适合ios中的此类任务?

我想到了一些,但我没那么有经验.

  1. 也许推送通知,当有新版本可用时,服务器需要向所有客户端发送消息.
  2. 或者,是否有类似Android的服务可以提供帮助?
  3. 或者,也许每次应用程序启动(或前往前台)时,只需ping服务器并查看是否有新内容.
  4. 或者,每次应用程序开始ping服务器并在下一个12h添加一个计时器,以防此应用程序仍然在前台.
  5. 或者,每次应用程序启动时,检查首选项值,如果上次服务器被ping的时间超过12小时,则立即ping它.然后保存此ping时间.

选项1在服务器上可能更重,实现起来可能更复杂(考虑使用ios newbe),但可能是实际后台更新的唯一选择.但即便如此,我仍然不希望用户必须对某些低级数据更新b/wa客户端和服务器做出反应(这就是它),所以除非推送通知可以直接进入应用程序并执行没有用户干预的东西,那么这个选项不会飞.
选项3-5都是可能的,听起来不是太难,但它们只能在应用程序位于前台时工作.

据我所知,后台应用程序只能播放音乐,获取位置更新或voip更新.甚至有这种黑客的声音试图逃避这种限制的无声声音.(并未获准进入商店).

也许在地方的限制是正当理由,让我怎么遵守游戏规则,并能够实现定期服务器的ping(或者更一般地说,解决周期同步的问题的B/W客户端和服务器,即使应用在BG )?

谢谢

background push-notification ios

12
推荐指数
2
解决办法
7362
查看次数

是否有基于JVM的度量库的python版本

我正在寻找python中的性能指标库.

我熟悉Coda Hale的指标,它是为JVM编写的,所以我想知道是否有一个等效的python(并且没有使用JVM).

简而言之,该工具的要求列表将是:

  • 在执行时计算不同类型的指标.计数器,仪表,仪表,定时器,柱状图等,有一个漂亮的名单在这里
  • 允许通过HTTP API轻松访问运行时数据.(我可以自己包装HTTP层,但如果它已经在它中加了一个加号)
  • 特别是石墨插件或其他插件.CopperEgg会很好.或NewRelic.
  • 烘焙在常见库中的检测支持,例如memcached.

到目前为止,我发现PyCounters可以完成一些工作,但不是全部工作.它有点满足我的第一个子弹(但它没有所有的度量类型,只有三个),这就是全部.

是否有更好的替代PyCounters?

谢谢

python performance metrics performancecounter

10
推荐指数
2
解决办法
3292
查看次数

Maven多模块项目 - 在所有子模块完成后如何运行操作

我有一个多模块maven项目,我希望能够在所有子模块完成执行后运行一个操作(antrun).

在我的项目中,我从每个子模块构建RPM,在部署阶段,我将RPM(通过ssh)复制到RPM存储库.
RPM repo要求我在添加新RPM后运行createdb命令,以便它可以为它们编制索引.
所以我有一个实际上运行scp并将RPM复制到repo的antrun.它为每个实际产生RPM的子模块运行,并连接到maven 部署阶段.我能做的是在每个scp运行createrepo命令之后但是这很浪费,我有超过10个子模块,每个createrepo需要大约一分钟,所以我将浪费宝贵的构建时间.

我想做的是在所有子模块完成之后,然后运行createrepo.一旦.

我的第一次尝试是将调用createrepo命令的antrun挂钩到父pom(超级pom)部署阶段.我这样做了,问题是父节点的部署阶段子模块的部署阶段之前运行.我希望它
我无法将createrepo antrun附加到任何其他后续阶段之后运行,因为部署阶段是生命周期中的最后阶段.

所以我的问题是:在所有子模块的所有构建操作都成功结束之后,有没有办法运行一个"清理"antrun或一般插件,它会被执行一次?

围绕它的黑客将是创建另一个子模块,并通过使其依赖于所有其他模块并从该模块的部署阶段运行createrepo来确保它是最后一个.但这很丑陋而难以维持.我更喜欢清洁的解决方案.

谢谢

Maven版本是2.2.1

java maven-2

8
推荐指数
1
解决办法
1527
查看次数