Sau*_*rty 4 amazon-s3 apache-spark palantir-foundry foundry-data-connection
Within Palantir Foundry platform, I am working in Data integration. I need some help as I am new to Palantir software. Is there any documents, white-papers, links or tutorials on this topic?
How do I integrate data from another source, for example Amazon S3 or HDFS?
要集成来自另一个平台的数据,您需要数据连接中的源和同步。您需要拥有平台权限才能创建这些,并非所有用户都可以,因为它可能涉及组织数据治理策略。
假设您没有具有 S3 有效配置的源。你需要创建一个。在数据连接上,单击“源”,然后单击“新建源”。然后,您可以通过两种方式执行此操作:
File System新New Source下拉菜单并按照向导步骤操作Custom同一下拉列表。对于magritte-rest:
type: magritte-rest
url: 'https://foobar.organization.s3.amazonaws.com'
Run Code Online (Sandbox Code Playgroud)
现在要创建同步,请使用与此类似的配置:
type: rest-source-adapter
method: GET
path: the/path/in/s3/yourdata
outputFileType: csv
Run Code Online (Sandbox Code Playgroud)
还支持其他输出文件类型 ( json, zip, ...)
Palantir 通常在客户公司的内部网上提供问答论坛,以帮助开发人员解决问题。
此外,他们还提供现场支持,在 Foundry 工作区主页上有一个名为“培训和学习”的部分,提供示例和入门教程。
| 归档时间: |
|
| 查看次数: |
1412 次 |
| 最近记录: |