只是测试了AWS Redshift,并且发现了一些插件上的一些dupe数据,我希望在键列中重复出现失败,阅读文档会显示主键约束不是“强制的”.
任何人都想出如何防止主键重复(根据“传统”期望).
感谢任何Redshift先锋!
解决方法
创建记录时,我分配UUID.如果记录本身是唯一的,我使用类型4 UUID(随机),当不是我使用自然键作为输入使用类型5(SHA-1哈希).
那么您可以轻松地跟随 this instruction,以执行UPSERT.如果您的输入有重复的内容,您应该能够通过在您的登台表中发出类似于此的sql来进行清理:
那么您可以轻松地跟随 this instruction,以执行UPSERT.如果您的输入有重复的内容,您应该能够通过在您的登台表中发出类似于此的sql来进行清理:
CREATE TABLE cleaned AS SELECT pk_field,field_1,field_2,... FROM ( SELECT ROW_NUMBER() OVER (PARTITION BY pk_field order by pk_field) AS r,t.* from table1 t ) x where x.r = 1