一般使用两种方案
方案一
通过数据库的加解密算法函数,在模糊查询的时候使用decode(key) like '%partial%'
。这样做的优点是实现成本低,缺点也很明显只能使用数据库支持的一些常规加解密算法。
方案二
对密文数据进行分词组合,将分词组合的结果集分别进行加密,然后存储到扩展列,查询时通过ext_key like '%partial%'
。
具体方法如下:
先对字符进行固定长度的分组,将一个字段拆分为多个,如根据4位英文字符,2个中文字符为一个检索条件。
举个例子:banshan123
使用4个字符为一组的加密方式,第一组bans
,第二组ansh
,第三组nsha
,第四组shan
… 依次类推。
拆分字段明文 | 拆分字段密文 |
---|---|
bans | xxxx1 |
ansh | xxxx2 |
nsha | xxxx3 |
n123 | xxxxn |
最终数据库字段如下
原字段key | 扩展列字段ext_key |
---|---|
banshan123 | xxxx1xxxx2xxxx3…xxxxn |
如果需要检索所有包含检索条件4个字符的数据比如:shan
,加密字符后通过 ext_key like '%partial%'
查库。
但是使用这种方式也有一定代价:
• 支持模糊查询加密方式,产出的密文比较长;
• 支持的模糊查询子句长度必须大于等于4个英文/数字,或者2个汉字。不支持过短的查询(出于安全考虑);
• 返回的结果列表中有可能有多余的结果,需要增加筛选的逻辑:对记录先解密,再筛选;
可以参考淘宝密文字段检索方案