我需要将一些python和java例程转换为我的硕士论文的伪代码,但是在编写语法/样式方面遇到了麻烦:
你怎么写伪代码?有没有标准的建议?
作为计算语言学的学生,我经常进行机器学习实验,我必须从各种不同的资源准备训练数据,如原始或注释文本语料库或语法树库.对于每个新任务和每个新实验,我编写程序(通常使用Python,有时是Java)来提取我需要的功能和值,并将数据从一种格式转换为另一种格式.这通常导致非常大量的非常大的文件和大量的小程序处理它们以获得某些机器学习框架的输入(如Weka的arff文件).
人们需要非常有条理地处理这个问题和计划,并且要小心谨慎,不要错过大量数据中的任何重要特性,例外或错误.良好的软件设计原则,如设计模式或重构范例,对于这些任务来说并不是很重要,因为安全性,可维护性或可持续性等问题并不重要 - 一旦程序成功处理了数据,就不再需要它了.到目前为止,我甚至已经停止了在Python代码和程序中使用类或函数的简单程序方式.下一个实验将需要具有独特特征和不同格式的不同数据集,以便无论如何都可能必须从头开始编程.到目前为止,我的经历是' 将80-90%的项目时间花在准备培训数据的任务上并不罕见.小时和日子只考虑如何从一种数据格式到另一种数据格式.有时,这可能会变得非常令人沮丧.
好吧,你可能猜到我有点夸张,甚至有目的,但我很肯定你理解我想说的话.实际上,我的问题是:
是否有任何通用框架,架构,最佳实践来处理这些任务?在优化设计的情况下,我希望能够重复使用多少代码?
我正在为Android应用程序扩展编写测试用例ActivityInstrumentationTestCase2
.测试类看起来像这样:
public class SolutionEntryActivityTest extends ActivityInstrumentationTestCase2<SolutionEntryActivity> {
public SolutionEntryActivityTest() {
super(SolutionEntryActivity.class);
}
}
Run Code Online (Sandbox Code Playgroud)
在eclipse中,此代码无法使用错误进行编译: Bound mismatch: The type SolutionEntryActivity is not a valid substitute for the bounded parameter <T extends Activity> of the type ActivityInstrumentationTestCase2<T>
但SolutionEntryActivity确实是一个android.app.Activity
,类型层次结构是这样的:
Activity
OrmLiteBaseActivity<H> (abstract)
KabowieActivity
PracticeActivity (abstract)
SolutionEntryActivity
Run Code Online (Sandbox Code Playgroud)
我在2004年和2005年发现了两个日食漏洞似乎处理了类似的问题,但这些问题应该是长期修复的.
我正在使用Eclipse Helios与Android 2.2和Sun Java 1.6.
知道发生了什么事吗?
C字符串以空值终止,这意味着在char数组中,索引strlen()
处的char 是一个字节,所有位都设置为0.我已经看到代码,而不是使用'\0'
整数0
.但是,因为sizeof(int) > sizeof(char)
这可能实际上超出了阵列的分配空间 - 我错了吗?或者编译器int
是否char
在这种情况下隐含地投了一个?
android ×1
c ×1
code-reuse ×1
eclipse ×1
generics ×1
java ×1
nlp ×1
pseudocode ×1
string ×1
unit-testing ×1