Bootstrap

数据库加密数据的模糊查询方案

一般使用两种方案

方案一

通过数据库的加解密算法函数,在模糊查询的时候使用decode(key) like '%partial%'。这样做的优点是实现成本低,缺点也很明显只能使用数据库支持的一些常规加解密算法。

方案二

对密文数据进行分词组合,将分词组合的结果集分别进行加密,然后存储到扩展列,查询时通过ext_key like '%partial%'

具体方法如下:

先对字符进行固定长度的分组,将一个字段拆分为多个,如根据4位英文字符,2个中文字符为一个检索条件。

举个例子:banshan123使用4个字符为一组的加密方式,第一组bans ,第二组ansh ,第三组nsha ,第四组shan … 依次类推。

拆分字段明文拆分字段密文
bansxxxx1
anshxxxx2
nshaxxxx3
n123xxxxn

最终数据库字段如下

原字段key扩展列字段ext_key
banshan123xxxx1xxxx2xxxx3xxxxn

如果需要检索所有包含检索条件4个字符的数据比如:shan ,加密字符后通过 ext_key like '%partial%' 查库。

但是使用这种方式也有一定代价:
• 支持模糊查询加密方式,产出的密文比较长;
• 支持的模糊查询子句长度必须大于等于4个英文/数字,或者2个汉字。不支持过短的查询(出于安全考虑);
• 返回的结果列表中有可能有多余的结果,需要增加筛选的逻辑:对记录先解密,再筛选;

可以参考淘宝密文字段检索方案

;