高要求的数据水印
通常来说,不同于传统型非结构类文件,数据水印对水印不可见性以及水印质量要求更高。数据水印在数据文件(数据库、文本文件、表格等)中嵌入的水印,需带有数据接收方等标识信息、隐形标记,且不易被发现也不易被破坏。如果发生了数据泄漏,可以时间从泄漏的数据中提取水印标识,并通过数据水印追溯还原整个泄漏的数据流转全流程,溯源到操作数据用户身份、作业及泄露范围和渠道。
电商数据库水印技术
高要求的数据水印
通常来说,不同于传统型非结构类文件,数据水印对水印不可见性以及水印质量要求更高。数据水印在数据文件(数据库、文本文件、表格等)中嵌入的水印,需带有数据接收方等标识信息、隐形标记,且不易被发现也不易被破坏。如果发生了数据泄漏,可以时间从泄漏的数据中提取水印标识,并通过数据水印追溯还原整个泄漏的数据流转全流程,溯源到操作数据用户身份、作业及泄露范围和渠道。
数据水印技术
1.伪行水印
伪行水印指在对某些外发数据添加水印时,通过添加人为生成的若干整行信息,并从中挑选某些字段植入水印信息的技术。这些筛选的植入水印的字段一般常见于、电话号、号、交易金额等字段。
2.伪列水印
伪列水印指通过对分发数据中,人为构造增加一列,并在其中植入水印的机制。
3.脱敏水印
脱敏水印指在增加行和列的情况下,通过对原始数据中某些字段按照一定的水印植入规则进行脱敏变形,产生的脱敏后数据植入了水印信息的技术。
数据水印
数据开放共享能促进数据价值的释放,然而也带来更多的数据泄露风险。同一份数据的共享(或多次分发过程)往往涉及到多个数据接收机构,若其中一方由于安全失责原因导致了数据泄露,数据泄露后如何正确溯源到真正的泄露方呢?这是溯源的第二类场景,如图4所示:分发机构在原始数据库嵌入不同的水印信息(如机构ID、时间戳)给不同的接收机构。一旦发生相关的数据泄露,分发机构可提取泄露数据库的水印信息,通过溯源取证,进而对泄露主体进行追责。从合规视角看,针对组织机构的泄露溯源可促进数据接收方落实数据安全保护责任,强化接收方实施相应级别的安全措施。
数据水印性质
(1) 鲁棒性:数据库遭到有意或无意处理后水印的提取情况。如:增加、删除或篡改操作。评价指标:误码率(BER)。
(2) 保真性:含水印数据库与原始数据库的数据差别。评价指标:平均误差(MAE)。
(3) 水印容量:可嵌入的有效载荷。评价指标:嵌入率(ER)。
(4) 计算代价:水印算法的计算代价。评价指标:算法的时间复杂度(O)。
(5) 安全性:根据Kerckhoff法则,水印算法是公开的,其安全性依赖于水印密钥,攻击者在知晓嵌入和提取算法的情况下也无法检测或去除水印。
(6) 可用性:嵌入水印后数据库不影响数据挖掘和统计分析等应用。
(作者: 来源:)