一水 发自 凹非寺
量子位 | 公众号 QbitAI
最近,这个AI证件照神器狠狠火了~
本·漫不经心上传了一张哈利波特的照片,结果啪的一下,一张蓝底证件照就生成了!
更关键的是,这个神器目前免费开源,人人都能立即上手使用。
神器名叫HivisionIDPhotos,最近几天一直挂在GitHub热榜上,目前已狂揽3.2K星标。
除了能换背景,它还支持轻量级抠图、选择不同规格和用途的标准证件照,以及方便打印的六寸排版照。
已经体验过的网友纷纷感慨:
AI实用技能拉满例子之一。以后随便拍一下,直接AI帮制作。
第一批“体验用户”马斯克,已经安排上了。
还有人在线调侃,已经推荐给老马了,等他考公用得上(doge)。
话说,这个神器的作者还是一名来自西安电子科技大学的博士生。
这就替大家试试
下面,我们抢先替大家试一波。
项目作者提供了网页demo,当前有中英两个版本,我们直接上中文。
这第一关,当然是考验AI的抠图能力。
假设情形是“用日常照制作一张正式场合证件照”,看这个工具能否应对不时之需。
事先提醒,这个工具尚不支持换正装,所以上传的照片,我们还是得老老实实自带正装。
比如下面这张背景稍显杂乱的照片:
有一说一,从结果来看,抠图感还是比较明显,真要用到正式场合还是让人犹豫。
不过假如换成其他照片,仅从抠图来看,效果好像还不错?
从官方提供的示例来看,感觉原图本身质量就很高了。
所以我悟了,以后我们拍一次证件照,后续都可以用这个工具来换背景、换尺寸,主打一个省钱。
目前一些常见尺寸和用途都安排上了,考公、考教资、大学生四六级……
还有方便大家打印的六寸排版照。
BTW,这个工具目前提供了基于FastAPI的API服务,也支持Docker部署,使得用户可以在不同操作系统环境中快速搭建和运行服务。
项目能够运行在Linux、Windows和MacOS平台,支持Python 3.7及以上版本
据作者ZeYiLin透露:
抠图模型是MODNet+网上的开源证件照数据微调的,转成了ONNX来加速推理;人脸检测模型用的是MTCNN,也转成了ONNX,整套代码在CPU上运行的时长还可以接受(不过也有很大的优化空间)。
下一步,从项目主页来看,作者还计划提供美颜和换装功能。
总之,从目前大家的体验来看,完全从随手拍到证件照还差点意思。(也需要碰运气)
不过想法不错,可以分场合个人使用。
作者来自西安电子科大
项目作者ZeYiLin(林泽毅),是西安电子科技大学的博一学生,师从电子工程学院吴家骥教授。
同时他也是SwanLab和SwanHub开源社区的创始人之一。
据个人主页介绍,他热衷于全栈工作,喜爱机器学习、UI/UX和产品顶层设计。
根据他在知乎发表的内容,HivisionIDPhotos所涉及的算法是他以前参与“互联网+创新创业大赛”的成果。
这是(我)开发的一个证件照制作小程序中使用的代码,目前在国内已经被接近100万人使用过了。
之所以现在选择开源,他坦言道:
随着AIGC浪潮的到来,证件照制作这个非常偏图像代码工程落地的场景有点old了。
当年有做线上海马体的想法。
最后,文末给大家放试玩地址了,欢迎评论区反馈~
在线体验demo:
https://swanhub.co/ZeYiLin/HivisionIDPhotos/demo
开源代码:
https://github.com/Zeyi-Lin/HivisionIDPhotos
参考链接:
[1]https://x.com/tuturetom/status/1830778702751506916
[2]https://x.com/imxiaohu/status/1829870064352575576
— 完 —
量子位年度AI主题策划正在征集中!
欢迎投稿专题 一千零一个AI应用,365行AI落地方案
或与我们分享你在寻找的AI产品,或发现的AI新动向
点这里👇关注我,记得标星哦~