我触及了Teradata.我从未接触过hadoop,但从昨天开始,我正在研究这个问题.通过对两者的描述,它们似乎是可以互换的,但在一些文章中写道它们用于不同的目的.但我发现的一切都是模糊的.我很迷惑.
有谁有经验吗?他们之间有什么严重的区别?
简单示例:我想构建ETL,它将转换数十亿行原始数据并将它们组织成DWH.然后对它们进行一些资源昂贵的分析.为何使用TD?为何选择Hadoop?或者为什么不呢?
我们试图做这样的图:

问题出在红色圆圈中。我们不希望箭头在那里。但是,当我们关闭它们时,这些数字将重叠。怎么解决呢?(如使箭头不可见等)
我正在尝试建立一个数据集市.
我有很多维度和一些措施 - 事实.每项措施都与业务方面的所有维度相关联.有一种标准方法,将有一个包含所有措施的重要事实表.
但我有一个想法:如果每个度量都有单独的事实表,该怎么办?它将如何处理数据库性能,解决方案扩展性等?
编辑:::在非常复杂的企业环境中,基于olap立方体的巨大解决方案.因此,首先需要的是易于扩展和维护,然后是性能
extensibility database-design data-warehouse fact-table business-intelligence
起初,这个问题听起来真的很愚蠢,但它并不是根本性的.也许,任何算法看起来都无法解决,但我假装说它是.
所以问题.我有图表,例如黄金.我需要找到顶部和底部按时轴向的位置.问题是我需要找到重大上升和重大衰退的起点.问题是存在许多小的无关紧要的上升和下滑.
这是为了更好地理解的图片 - 我想要找到的红点(不完全是,但在某种程度上像这样).

所以我可能需要过滤小的翻身和调低,但不知道该怎么做.任何想法我都会很高兴.我不需要java等算法,只需用语言即可.
我可以像这样定义构造函数吗?附加问题:我可以在构造函数中调用类的构造函数吗?
class SubArray
{
List<int> array;
string parent;
string name;
SubArray child;
public SubArray(SubArray child, string name)
{
this.child = child;
List<int> array = new List<int>();
this.name = name;
}
}
Run Code Online (Sandbox Code Playgroud) 我正在开发项目,从头开始实施更小的数据集市(可能是30个表).现在,对这个市场有深入了解的同事将要做另一个项目,让我独自一人参与这个项目(得到他的一些支持).
我只是认为我生成了数据库图表,因此当我修改ETL并做一些连接等时我不需要任何额外的帮助.但是,令我惊讶的是,这个职业的新手...
我生成了图表,没有星形或雪花模式,只有没有主键和外键的普通表.所以我的工作是试图想象表格是如何相关的,如果它是真的那么请查阅它,然后重新制作我的剧本等.恼人的.
当我问为什么会这样(没有表之间的关系)时,我得到了这个答案:"这是因为性能."
像往常一样解决它吗?如果不是,如何解决它与关系和仍然良好的表现?
这段代码的行为是什么?将s =="更改实例"或s =="初始实例"?
SomeClass instance = new SomeClass();
instance.setName("initial instance")
List<SomeClass> list1 = new List<SomeClass>();
List<SomeClass> list2 = new List<SomeClass>();
list1.add(instance);
list2.add(instance);
list2.get(0).setName("changed instance");
string s = list1.get(0).getName();
Run Code Online (Sandbox Code Playgroud)
编辑:好的,我对代码做了一些更改.我写得很快.编辑2:为什么我问这个,不试试?因为有一些限制我在这台电脑上没有IDE.