小编Pet*_*ter的帖子

Vertica:重复/主键的数据验证

我正在尝试在检查以确保数据不重复的加载期间创建验证过程.Vertica本身不支持此功能:

运行查询时,Vertica会检查约束违规,而不是在加载数据时检查.要在加载过程中检测约束违规,请使用带有NO COMMIT选项的COPY(第667页)语句.通过在不提交数据的情况下加载数据,您可以使用ANALYZE_CONSTRAINTS函数对数据进行后加载检查.如果函数发现约束违规,则可以回滚负载,因为您尚未提交它.

问题是我无法弄清楚如何以编程方式执行此操作.我怀疑我需要一个存储过程,但我不熟悉vertica的存储过程语法/限制.你能帮我吗？这就是我所拥有的:

-- Create a new table. "id" is auto-incremented and "name" must be unique
CREATE TABLE IF NOT EXISTS my_table (
id IDENTITY
, name varchar(50) UNIQUE NOT NULL
, type varchar(20)
, description varchar(200)
);

--Insert a record
begin; 
copy my_table from stdin
abort on error
NO COMMIT; -- this begins the load
name1|type1|description1 --this is the load
\. -- this closes the load
commit;

-- insert the duplicate record
begin; 
copy my_table from stdin
abort …

Run Code Online (Sandbox Code Playgroud)

sql database database-design duplicates vertica

Pet*_*ter

2012 09-29

7
推荐指数

1
解决办法

4503
查看次数

Chrome开发工具如何显示Cookie

当我打开Chrome开发工具的资源面板时,我看到很多域都设置了很多cookie.我理解第一方和第三方cookie之间的定义差异,但我仍然理解它的含义.

Chrome如何显示第一方Cookie和第三方Cookie？例如,当我访问Vice.com时,我在左栏中看到了许多域名(www.vice.com,platform.tumblr.com等); 如果我在左栏中选择www.vice.com,我会看到更多域名(.google.com,.ads.pubmatic.com,.scorecardresearch.com等).

我该怎么解释这个？

在此输入图像描述

cookies google-chrome google-chrome-devtools

Pet*_*ter

lucky-day

6
推荐指数

1
解决办法

2653
查看次数

pandas：使用 to_excel 写入现有 Excel 文件 (xlsx)

我有一个简单的用例，df.to_excel()我正在努力解决这个问题。我想写入现有 XLSX 工作簿的特定工作表选项卡（我们称之为“数据”），其他选项卡上的公式和数据透视表可以引用该工作表选项卡。

我尝试以两种方式修改 ExcelWriter，但都从 openpyxl 中产生错误。

使用 get_sheet_by_name 读取现有工作表（此错误：“NotImplementedError：改用 'iter_rows()'”。）

使用create_sheet 创建一个新工作表。（此错误：“ReadOnlyWorkbookException：无法在只读工作簿中创建新工作表”）

df=DataFrame()
from openpyxl.reader.excel import load_workbook
book = load_workbook('my_excel_file.xlsx', use_iterators=True) # Assume my_excel_file.xlsx contains a sheet called 'Data'
class temp_excel_writer(ExcelWriter): # I need this to inherit the other methods of ExcelWriter in io/parsers.py
def __init__(self, path, book):
    self.book=book
    test_sheet=self.book.create_sheet(title='Test') # This errors: ReadOnlyWorkbookException
    self.use_xlsx = True
    self.sheet_names=self.book.get_sheet_names()
    self.actual_sheets=self.book.worksheets
    self.sheets={}
    for i,j in enumerate(self.sheet_names):
      self.sheets[j] = (self.actual_sheets[i],1)
    self.cur_sheet = None
    self.path = save
my_temp_writer=temp_excel_writer('my_excel_file.xlsx', book)
df.to_excel(my_temp_writer, sheet_name='Data') …

Run Code Online (Sandbox Code Playgroud)

python pandas openpyxl

Pet*_*ter

2017 01-05

5
推荐指数

1
解决办法

8606
查看次数

将元素分组到列表中

我想根据索引将元素分组到列表列表中，从数据中的第一个位置开始，直到下一个 False。这就是一个分组。继续直到最后一个元素。

data = ['a','b','c','d','e','f'] 
indexer = [True, True, False, False, True, True]

Run Code Online (Sandbox Code Playgroud)

结果将是：

[['a','b','c'], ['d'], ['e','f'] ]

Run Code Online (Sandbox Code Playgroud)

itertools groupby 是正确的解决方案吗？我对如何实现它有点困惑。

python python-itertools python-3.x

Pet*_*ter

lucky-day

1
推荐指数

1
解决办法

88
查看次数

Python 日期时间和日期类型

与此问题略有不同。datetime.date 对象是 datetime.datetime 对象的子集吗？是否存在变量既可以是 datetime.date 类型又可以是 datetime.datetime 对象的情况？

下面，我创建了一个 datetime.datetime 对象，它似乎也作为 datetime.date 对象进行验证。想法？

In [1]: import datetime

In [2]: x = datetime.datetime(2013, 7, 13, 13, 0)

In [3]: isinstance(x, datetime.date)
Out[3]: True

In [4]: isinstance(x, datetime.datetime)
Out[4]: True

Run Code Online (Sandbox Code Playgroud)

python datetime python-2.7

Pet*_*ter

2017 05-23

0
推荐指数

1
解决办法

579
查看次数