抖音旋转验证码角度识别方案

一、简介

上图是抖音最新的旋转验证码，和老款旋转验证码相比，现在新增了很多防御措施，比如内圈小图增加了白色花边，内外圈图片颜色有一定差异等等。所以给我们识别增加了很大难度。

二、免费识别方法介绍

经过我们大量的数据标注，我们终于完成了这款验证码的角度识别。我们可以完成原图、截图两种识别方式，并且正确率可以达到99%左右。我们封装成了接口，大家可以在这里免费测试识别效果：得塔云

大家可以根据下图所示，点击在线获取图片，然后得到图片，最后点击识别

识别效果如下，下面就会看到图片矫正效果，因为实际旋转是中间小图顺时针旋转，外圈大图是逆时针旋转，所以下图识别的69度就是小图顺时针旋转69度，外圈大图是逆时针旋转69度的结果。

三、识别代码

1、原图识别

原图识别是指通过网站上图片链接直接下载的图片，具有固定的图片尺寸，大图347×347、小图211×211，如下图所示

python识别代码如下

import base64
import requests
import datetime
import numpy as np
from io import BytesIO
from PIL import Image

t1 = datetime.datetime.now()

#PIL图片保存为base64编码
def PIL_base64(img, coding='utf-8'):
    img_format = img.format
    if img_format == None:
        img_format = 'JPEG'

    format_str = 'JPEG'
    if 'png' == img_format.lower():
        format_str = 'PNG'
    if 'gif' == img_format.lower():
        format_str = 'gif'

    if img.mode == "P":
        img = img.convert('RGB')
    if img.mode == "RGBA":
        format_str = 'PNG'
        img_format = 'PNG'

    output_buffer = BytesIO()
    # img.save(output_buffer, format=format_str)
    img.save(output_buffer, quality=100, format=format_str)
    byte_data = output_buffer.getvalue()
    base64_str = 'data:image/' + img_format.lower() + ';base64,' + base64.b64encode(byte_data).decode(coding)

    return base64_str

# 旋转图片
def rotate_img(img, angle):
    # 转换为有alpha层
    temp_img2 = img.convert('RGBA')
    # 旋转
    rot = temp_img2.rotate(-angle)
    # 创建一个与旋转图像大小相同的白色图像
    fff = Image.new('RGBA', rot.size, (255, 255, 255, 0))
    # 使用alpha层的rot作为掩码创建一个复合图像
    out = Image.composite(rot, fff, rot)
    # 将临时图片转换为元素图片颜色模式
    temp_img2 = out.convert(img.mode)

    return temp_img2

# 加载外圈大图
img1 = Image.open(r'E:\Python\lixin_project\OpenAPI接口测试\test_img\58-1.png')
# 图片转base64
img1_base64 = PIL_base64(img1)
# 加载内圈小图
img2 = Image.open(r'E:\Python\lixin_project\OpenAPI接口测试\test_img\58-2.png')
# 图片转base64
img2_base64 = PIL_base64(img2)

# 验证码识别接口
url = "https://www.detayun.cn/openapi/verify_code_identify/"
data = {
    # 用户的key
    "key":"EI4vT8UGFTXRE4hZR7cE",
    # 验证码类型
    "verify_idf_id":"58",
    # 外圈大图
    "img1":img1_base64,
    # 内圈小图
    "img2":img2_base64,
}
header = {"Content-Type": "application/json"}
# 发送请求调用接口
response = requests.post(url=url, json=data, headers=header)

# 获取响应数据，识别结果
print(response.text)
print("耗时：", datetime.datetime.now() - t1)
angle = response.json()['data']['angle']

# 使用crop方法裁剪图片
s_img = img2
b_img = img1
# 旋转图片
b_img = rotate_img(b_img, -angle)
s_img = rotate_img(s_img, angle)
# 将小图粘贴到大图的中心
b_img.paste(s_img, (70, 70))
b_img.show()

运行上面代码，可以直接看到识别后的拼接效果图

2、截图识别

截图识别对图片有一定的要求，必须是对圆形图片切边截取，截取下来应该是一个正方形。如果切边截图不标准，可能会影响到识别正确率。

切边截取样例图如下，比如如下图蓝线所示，与圆形外切：

python识别代码如下：


import base64
import requests
import datetime
import numpy as np
from io import BytesIO
from PIL import Image

t1 = datetime.datetime.now()

#PIL图片保存为base64编码
def PIL_base64(img, coding='utf-8'):
    img_format = img.format
    if img_format == None:
        img_format = 'JPEG'

    format_str = 'JPEG'
    if 'png' == img_format.lower():
        format_str = 'PNG'
    if 'gif' == img_format.lower():
        format_str = 'gif'

    if img.mode == "P":
        img = img.convert('RGB')
    if img.mode == "RGBA":
        format_str = 'PNG'
        img_format = 'PNG'

    output_buffer = BytesIO()
    # img.save(output_buffer, format=format_str)
    img.save(output_buffer, quality=100, format=format_str)
    byte_data = output_buffer.getvalue()
    base64_str = 'data:image/' + img_format.lower() + ';base64,' + base64.b64encode(byte_data).decode(coding)

    return base64_str

# 旋转图片
def rotate_img(img, angle):
    # 转换为有alpha层
    temp_img2 = img.convert('RGBA')
    # 旋转
    rot = temp_img2.rotate(-angle)
    # 创建一个与旋转图像大小相同的白色图像
    fff = Image.new('RGBA', rot.size, (255, 255, 255, 0))
    # 使用alpha层的rot作为掩码创建一个复合图像
    out = Image.composite(rot, fff, rot)
    # 将临时图片转换为元素图片颜色模式
    temp_img2 = out.convert(img.mode)

    return temp_img2

# 加载外圈大图
img1 = Image.open(r'E:\Python\lixin_project\OpenAPI接口测试\test_img\58-5.jpg')
# 图片转base64
img1_base64 = PIL_base64(img1)

# 验证码识别接口
url = "https://www.detayun.cn/openapi/verify_code_identify/"
data = {
    # 用户的key
    "key":"EI4vT8UGFTXRE4hZR7cE",
    # 验证码类型
    "verify_idf_id":"58",
    # 外圈大图
    "img1":img1_base64,
    # 内圈小图
    "img2":"",     # 这里必须设置为空字符串
}
header = {
    "Content-Type": "application/json"
}
# 发送请求调用接口
response = requests.post(url=url, json=data, headers=header)

# 获取响应数据，识别结果
print(response.text)
print("耗时：", datetime.datetime.now() - t1)
angle = response.json()['data']['angle']

width, height = img1.size
# 判断图片的形状是否是300x300
if width != 300 or height != 300:
    # 如果不是，则调整图片大小到300x300
    img = img1.resize((300, 300), Image.ANTIALIAS)  # 注意：应该是 Image.ANTIALIAS 或 Image.ANTIALIASED
# 定义裁剪区域（左上角坐标，宽度，高度）
# 这里的坐标和尺寸都是基于像素的
crop_rectangle = (55, 55, 245, 245)  # 例如：(100, 100, 400, 400) 表示从(100, 100)开始裁剪，宽度和高度都是300像素
# 使用crop方法裁剪图片
s_img = img.crop(crop_rectangle)
b_img = img
# 旋转图片
b_img = rotate_img(b_img, -angle)
s_img = rotate_img(s_img, angle)
# 将小图粘贴到大图的中心
b_img.paste(s_img, (55, 55))
b_img.show()

想了解更多验证码识别，请访问：得塔云