从DATETIME中提取TIME - informix

 <Microsoft.SqlServer.Dts.Tasks.ScriptTask.SSISScriptTaskEntryPointAttribute()> _
<System.CLSCompliantAttribute(False)> _
Partial Public Class ScriptMain
 Inherits Microsoft.SqlServer.Dts.Tasks.ScriptTask.VSTARTScriptObjectModelBase

 Public Sub Main()

    Using sr As New IO.StreamReader(Dts.Variables("strFilename").Value.ToString)

        Dts.Variables("strQuery").Value = sr.ReadToEnd()
        sr.Close()

    End Using

    Dts.TaskResult = ScriptResults.Success
End Sub

End Class

Run Code Online (Sandbox Code Playgroud)

变量

t-sql sql-server ssis etl ssis-2012

use*_*933

2018 01-20

3
推荐指数

1
解决办法

644
查看次数

Airflow - 如何在 for 循环的迭代之间设置任务依赖关系？

我正在使用 Airflow 在 for 循环中运行一组任务。循环的目的是遍历数据库表名列表并执行以下操作：

for table_name in list_of_tables:
    if table exists in database (BranchPythonOperator)
        do nothing (DummyOperator)
    else:
        create table (JdbcOperator)
    insert records into table (JdbcOperator, Trigger on One Success)

Run Code Online (Sandbox Code Playgroud)

在 Web UI 上，这看起来像：

目前，Airflow 是从上到下然后从左到右执行此图中的任务，例如：tbl_exists_fake_table_one--> tbl_exists_fake_table_two-->tbl_create_fake_table_one等。

但是，insert声明 forfake_table_two取决于fake_table_one正在更新，Airflow 当前未捕获该依赖项。（从技术上讲，这种依赖关系是由的顺序捕获的list_of_table_names，但我相信在更复杂的情况下这会容易出错）

我希望与fake_table_one运行相关的所有任务，然后是与fake_table_two. 如何在 Airflow 中完成此操作？

完整代码如下：

for tbl_name in list_of_table_names:

    # Check if table exists by querying information tables
    def has_table(tbl_name=tbl_name):
        p …

Run Code Online (Sandbox Code Playgroud)

python etl airflow

enm*_*myj

lucky-day

3
推荐指数

1
解决办法

5237
查看次数

Spark增量加载会覆盖旧记录

我需要通过使用Spark（PySpark）对表进行增量加载

这是示例：

第一天

id | value
-----------
1  | abc
2  | def

Run Code Online (Sandbox Code Playgroud)

第二天

id | value
-----------
2  | cde
3  | xyz

Run Code Online (Sandbox Code Playgroud)

预期结果

id | value
-----------
1  | abc
2  | cde
3  | xyz

Run Code Online (Sandbox Code Playgroud)

这可以在关系数据库中轻松完成，
想知道是否可以在Spark或其他转换工具（例如Presto）中完成？

etl presto apache-spark pyspark

Sam*_*han

lucky-day

3
推荐指数

1
解决办法

1125
查看次数

如何修复“[OData Source [56]] 错误：无法从运行时连接管理器获取托管连接。” SSIS 中的错误？

我在运行从 SharePoint 列表中提取数据的 SSIS 时遇到问题。SSIS 包运行良好，直到 2 周前，突然包失败并出现以下错误：

[OData Source [56]] 错误：无法从运行时连接管理器获取受管连接。[SSIS.Pipeline] 错误：OData 源验证失败并返回错误代码 0xC020801F。[SSIS.Pipeline] 错误：一个或多个组件验证失败。错误：任务验证期间出现错误

尝试：

将包属性中的 64 位调试选项更改为 false
http:// 代替 https://

我希望 SSIS 包能够从 SharePoint 列表中提取数据而不会出现任何问题，但最近面临上述错误消息，该消息已经运行了一年多。

服务器详细信息：Windows Server 2012 R2。

应用详情：Visual Studio 2010，.NET 框架 - 4.5

更新@ 2019-02-17

我们没有使用 Windows 身份验证，即使以管理员身份运行 SSDT，SSIS Passage 也会失败。我们能够在 ODATA 源中预览 Sharepoint 列表数据，但是包在触发时出现上述错误消息而失败

connection ssis etl sharepoint-list odata

Vij*_*jay

2020 06-20

3
推荐指数

2
解决办法

1万
查看次数

无效语法：使用初始排序键创建表排序键自动

我正在尝试target-redshift用于将数据推送到aws-redshift

https://pypi.org/project/target-redshift/

我airflow用来监控 etl 状态

这是错误日志，我不知道它是什么意思。几乎不存在 target-redshift 的在线文档。有什么办法可以解决这个错误吗？

[2021-03-07 15:04:11,841] {bash_operator.py:126} INFO - ERROR Exception writing records
[2021-03-07 15:04:11,841] {bash_operator.py:126} INFO - Traceback (most recent call last):
[2021-03-07 15:04:11,841] {bash_operator.py:126} INFO -   File "/usr/local/airflow/.virtualenvs/target-redshift/lib/python3.7/site-packages/target_postgres/postgres.py", line 300, in write_batch
[2021-03-07 15:04:11,841] {bash_operator.py:126} INFO -     {'version': target_table_version})
[2021-03-07 15:04:11,841] {bash_operator.py:126} INFO -   File "/usr/local/airflow/.virtualenvs/target-redshift/lib/python3.7/site-packages/target_postgres/sql_base.py", line 840, in write_batch_helper
[2021-03-07 15:04:11,841] {bash_operator.py:126} INFO -     metadata)
[2021-03-07 15:04:11,841] {bash_operator.py:126} INFO -   File "/usr/local/airflow/.virtualenvs/target-redshift/lib/python3.7/site-packages/target_postgres/postgres.py", line 588, in write_table_batch
[2021-03-07 15:04:11,841] …

Run Code Online (Sandbox Code Playgroud)

etl python-3.x amazon-redshift airflow

roj*_*r_1

lucky-day

3
推荐指数

1
解决办法

225
查看次数