小编Fas*_*ous的帖子

在Python csv中跳过多行

我正在连接到一个API以阻止一些数据.输出是一个报告,其中包含一个多行标题以及传统的单行标题.

例:

1. Document Name: Test
2. Document Date: 8/7/2015
3. Document ID: 3804804
4. Document Author: Joe Blow
5.
6. Date, ID, Name, Age, Sex, Result
7. 8/7/2015, 2808380, Sara Jenkings, 33, F, 208.20
Run Code Online (Sandbox Code Playgroud)

在这个例子中,我想跳过第1-5行,并将第6行的行写为标题行,将其后的所有其他行写为普通行.

现在,我知道如何跳过下一行(阅读器,无),但如果我知道要跳过的行数将始终为5行,如何跳过多行?

任何帮助深表感谢.我通常会使用数据库来跳过这些行,但我想看看我是否可以让Python正确保存数据而不需要数据库做更多工作.

python csv

9
推荐指数
1
解决办法
7034
查看次数

如何将UTF-8平面文件导入SQL Server 2008 R2?

我有一堆UTF-8编码的平面文件需要导入到SQL Server 2008 R2数据库中.散装刀片不能识别直径,也不能接受UTF-8.

我知道有很多关于SQL Server 2008如何处理UTF-8编码的文章,但我有点寻找任何更新的答案,因为大多数文章都是旧的.

有什么办法可以通过在插入之前转换它们或在插入期间运行进程来将这些平面文件放入数据库中吗?

我想远离手动转换每一个.此外,我尝试创建的SSIS包可以读取和分离数据.它似乎无法移动数据.:(

平面文件由Java生成.将java环境从UTF-8转换为任何其他编码都是不成功的.

注意

我无意存储UTF-8数据.我的分隔符很时髦,因为它是UTF-8.分离列和行时,SQL Server无法读取字符.而已.

sql-server unicode utf-8

8
推荐指数
1
解决办法
2万
查看次数

SSRS是否一次运行多个查询?

我正在尝试优化在同一个表上使用多个存储过程的报表.不幸的是,每个程序都在读取数百万条记录并汇总结果.这是一个非常强烈的报告读取,但每个存储过程都经过优化,可以在SSMS中快速运行.

我可以运行每个存储过程并在10到20秒内获得结果集.当我将它们全部放入SSRS中的一个报告中时,报告会超时.

每个存储过程总共有4个参数.全部定位到同一个表,只是以不同的方式聚合数据.这些表的索引与查询内联.它基于时间,用户和我用于COUNT()DISTINCT和NONDISTINCT的一个维度.

我认为问题在于SSRS在同一个表上同时运行4个程序而不是一个接一个地运行.这是真的?如果是这样,无论如何都要确保SSRS不会并行运行它们?

我唯一的选择是创建已经预先聚合的汇总表.然后只需从该表中运行报告.否则,我猜param嗅探也是可能的.

sql-server reporting-services ssrs-2008-r2

5
推荐指数
1
解决办法
2306
查看次数

你如何证明未知数?

使用CASE语句选择计数到多个列时,我遇到了问题.CASE语句如何为我工作就像是C/C++中的IF语句.如果该值等于X,则执行Y ELSE do Z.

为了帮助解释此问题,让我提供一个查询,该查询计算名为"名称"的列中的名称,并按"日期"列对其进行分组.

SELECT [Date]
       COUNT( CASE WHEN [Name] = 'John' THEN 1 ELSE NULL END) AS 'John',
       COUNT( CASE WHEN [Name] = 'Joe' THEN 1 ELSE NULL END) AS 'Joe',
       COUNT( CASE WHEN [Name] = 'Moe' THEN 1 ELSE NULL END) AS 'Moe',
       COUNT( CASE WHEN [Name] = 'Nick' THEN 1 ELSE NULL END) AS 'Nick',
       COUNT( CASE WHEN [Name] = 'Zack' THEN 1 ELSE NULL END) AS 'Zack'
FROM [MyDatabase].[dbo].[LogInData]
WHERE [Date] >= '2013-07-01'
GROUP BY …
Run Code Online (Sandbox Code Playgroud)

sql t-sql database sql-server pivot

4
推荐指数
1
解决办法
76
查看次数

Azure SQL数据仓库是否有分割字符串的方法?

做一些研究,我发现在Azure SQL数据仓库中拆分字符串没有很好的选择.它没有新的STRING_SPLIT()函数或OPENJSON()函数.它也不允许用户定义函数中的SELECT语句尝试创建自己的,就像社区所做的许多自定义拆分器功能一样.

因此,我想我会提出这样的问题:SQL数据仓库是否有分割字符串的方法以及最佳选择?

用例

您在SQL表中有一个字段,其值为"My_Value_Is_Good".目标是在SELECT语句中使用分隔符下划线将每个段拆分为单独的字段,或者最多写入新表.

我用过的解决方案

对我来说主要的是在数据进入数据仓库之前转换数据.我使用Python来解析数据.但是,较大的数据集确实会降低速度,并将其更多地分离到系统中的特定记录中.

sql-server data-warehouse azure-sql-database

4
推荐指数
1
解决办法
1987
查看次数

Terraform:如何引用 Terraform 云环境变量?

我正在使用 Terraform 云。我希望将 AWS 标签与我的资源结合使用。我想用当前的 GIT 分支名称标记 Terraform 中定义的每个资源。这样我就可以将开发与生产分开。

Terraform 有一个环境变量列表,它们确实引用了 GIT 分支名称及其在云中的服务:

TFC_CONFIGURATION_VERSION_GIT_BRANCH - This is the name of the branch that the associated Terraform configuration version was ingressed from (e.g. master).
Run Code Online (Sandbox Code Playgroud)

如何在示例 VPC 的以下资源中引用TFC_CONFIGURATION_VERSION_GIT_BRANCH环境变量?

resource "aws_vpc" "example_vpc" {
  cidr_block = "10.0.0.0/16"

  tags = {
    product = var.product
    stage = var.TFC_CONFIGURATION_VERSION_GIT_BRANCH
  }
}
Run Code Online (Sandbox Code Playgroud)

参考:https://www.terraform.io/docs/language/values/variables.html#environment-variables

terraform terraform-provider-aws

3
推荐指数
1
解决办法
1万
查看次数

如何在 DynamoDB 中查询 begin_with 来获取主键?

使用 boto3.dynamodb.condition.Key 的 begins_with 方法过滤结果的最佳方法是什么?

import boto3
from boto3.dynamodb.conditions import Key

dynamodb = boto3.resource('dynamodb')
table = dynamodb.Table('MyTable')
response = table.query(KeyConditionExpression=Key('myPrimaryKey').begins_with('americas'))
Run Code Online (Sandbox Code Playgroud)

结果虽然条件支持begins_with,但是查询不支持。不能在主键或排序键上使用begins_with吗?

python amazon-dynamodb boto3

1
推荐指数
1
解决办法
8696
查看次数

水平计数列

我有一个水平透视表中有200列数据的视图.我想在这200列中使用COUNT()或SUM().如何在不编写大量SQL查询的情况下完成此操作,我必须将每列写出来?

我多么想象:

COUNT( [Column 1] -> [Column 200]) // Counts all values in Column 1 through Column 200.
Run Code Online (Sandbox Code Playgroud)

它是如何真的:

COUNT([Column 1]) +  COUNT([Column 2 ]) +  COUNT([Column 3])... AS 'Total'
Run Code Online (Sandbox Code Playgroud)

注意:

我正在将此计数插入到另一个查询中,我将按其他列名称进行分组.

sql t-sql sql-server

0
推荐指数
1
解决办法
780
查看次数

如何使 ROW_NUMBER 处理重复记录?

我有一个包含重复事务记录的表。这些都是不错的重复项,但需要为它们分配值以使它们对于表来说是唯一的。记录的用途是按时间顺序查看它们,我使用 ROW_NUMBER 按 ID 和 ORDER BY 时间对它们进行分区。

有时它有效。有时会失败。

例子

CASE WHEN [Record] = 'Start' 
     THEN 0 
ELSE -1 + ROW_NUMBER() OVER(PARTITION BY [ID] ORDER BY [Date] DESC
END AS [RowNo]
Run Code Online (Sandbox Code Playgroud)

预期成绩

ID,   Date,  RowNo
2002, 12:30, 1
2002, 12:29, 2
2002, 12:29, 3
2002, 12:29, 4
2002, 12:28, 5
3212, 01:10, 1
3212, 01:09, 2
3212, 01:08, 3
Run Code Online (Sandbox Code Playgroud)

实际结果

ID,   Date,  RowNo
2002, 12:30, 1
2002, 12:29, 2 <---Right
2002, 12:29, 2 <---Wrong
2002, 12:29, 3 <---Right
2002, 12:28, …
Run Code Online (Sandbox Code Playgroud)

t-sql sql-server sql-server-2008

0
推荐指数
1
解决办法
7708
查看次数