YOLO v3、FaceNet和SVM的人脸检测识别系统源码(python)分享
haoteby 2025-05-02 18:28 28 浏览
先转发,然后关注@大数据java架构师 私信“人脸”获取下载链接
项目简介
fine-tune YOLO v3 + FaceNet进行人脸识别,辨别。
1. 项目结构
--data
--|------baseface 图片、根据这些图片训练的128d向量,以及文件夹与人名的映射文件
---------|------0 第一个人的图片tag=0
---------|------1 第二个人的图片tag=1
......
---------|------n 第n个人的图片tag=n
---------|------map.txt 文件夹与人名的映射,依次放即可
---------|------vector.csv 根据这些图片得到的128维向量以及其类别(文件夹名)
--|------weights_facenet 模型文件(facenet)
--|------weights_yolo 模型(fune-tuning的yolo v3)
--|------weights_svm 模型(根据csv文件训练的svm模型)
--|------face-names 预测类别,默认即可
--|------yolo_anchors.txt 训练yolo v3时聚类得到的anchors框
--net yolo和facenet的网络
--preprocessing 预处理工具,下文的使用方法前期步骤都需要在这里运行
--setting 模型参数,可根据需要修改
--utils 封装的一些方法
--test.py 主体方法
2.模型文件(权重)
先转发,然后关注@大数据java架构师 私信“人脸”获取
3.yolo v3
YOLO v3的详细预测和训练,可到本人另一个项目YOLO_v3_tensorflow了解。
4.踩的坑
- fine-tune yolo v3时使用的是wider face数据集,其中有两个标注框是宽度或高度为0的,错误标注,筛选的时候需要去除掉这两个标注框,否则nms会报除0的异常。
- 训练svm时,需要标准化,预测时需要用同参数标准化再预测,否则svm预测结果都相同。
- 之前使用model-20170512-110547模型,输出128d向量,效果不好,换成model-20180402-114759模型,输出512d向量,效果有所提升。
- 每个人15张脸部图片,训练svm效果一般,可以增大样本量或者使用一些svm的tricks。
三、使用方法
项目需要安装以下包
numpy
pandas
opencv-python
scikit-learn
tensorflow
pillow
1.放置模型文件
下载yolo_face和facenet模型文件,放置在data文件夹下,如图
2.制作自己的人脸数据集
截取需要识别的人物的脸部图片,一人一个文件夹,文件夹名称从0开始依次累加,放在路径data/base_face下。
并修改data/map.txt,以空格分隔,下标和人脸文件夹名一一对应(map.txt中第一条下标为0,对应data/base_face/0文件夹)。
3.使用工具将图片转换成向量并存储
运行
preprecessing/pre_tools.py内的save_vector_csv(),自动将图片使用facenet转换为128d或512d向量,并存储为data/base_face/vector.csv。
4.训练svm分类器
基于已经储存的vector.csv文件,进行标准化后,运行
preprecessing/pre_tools.py内的train_face_svm(),使用scikit-learn训练svm模型,并储存在data/weights_svm/svm.pkl中。
5.开始测试
5.1图片测试
放在data/test_img下,将setting/yolo_args.py中的detect_object改为img,input_image 改为图片路径。
运行根目录下的test.py文件。
另外如果要存储检测后的图片,将setting/yolo_args.py中的output_image改为要存储的路径,并保证各层级文件夹存在。
5.2视频测试
放在data/test_video下,将setting/yolo_args.py中的detect_object改为video,input_video 改为视频路径。
运行根目录下的test.py文件。
另外如果要存储检测后的视频,将setting/yolo_args.py中的output_video改为要存储的路径,并保证各层级文件夹存在。
先转发,然后关注@大数据java架构师 私信“人脸”获取下载链接
相关推荐
- 谷歌开源大模型评测框架正式发布,AI模型评测难题迎刃而解
-
近日科技巨头谷歌正式推出其开源大模型评测框架LMEval,这一创新工具为全球AI开发者和企业提供了标准化的模型评估解决方案。LMEval的发布不仅标志着AI模型评测迈入透明化时代,更通过多项核心技术...
- Android 开发中文引导-动画和图形概述
-
安卓系统提供了各种强大的API,用来将动画应用于界面元素和自定义2D和3D图形的绘制当中。下面的小节大概的描述了可用的API和系统功能并帮助你决定那个方案最适合你的需要。动画安卓框架提供了两种动画系统...
- Qt5 C++入门教程-第12章 绘图(QPainter)
-
QPainter类在Qt5中进行绘图时起着重要作用。绘图操作是通过QPainter类在响应paintEvent方法时完成的。线条在第一个示例中,我们在窗口的客户区绘制了一些线条。line...
- 文创测评︱《如意琳琅图籍》:本土原创解谜书的胜利?
-
设想这样一个场景,你打开一本书,就化身为乾隆三十六年紫禁城中的画画人周本,有一天你在故纸堆中找到一本神秘的《如意琳琅图籍》,踏上寻宝旅程,历经各种离奇复杂的故事……这是故宫与奥秘之家联手打造的创意解谜...
- gif动图制作攻略!快快收藏(求gif制作的动图)
-
有事没事斗图玩是当下人们乐此不疲的事情,手里的gif动图也渐渐成为了人们抬杠互怼的一大资本。好有趣,好炫酷,gif是怎么做出来的?我也想做。什么?你不会?没关系,我来教你!首先介绍一下制作gif动图需...
- eduis未能初始化界面 无法启动 问题解决办法
-
1.如果edius安装后启动后出现failedtoinitializeskin中文提示无法初始化界面的错误。这说明你的电脑安装了双显卡,而edius所使用的是图形显卡。可以选择edius图标右键...
- Flash Player模拟器更新:Rufffle(flash模拟器安卓下载高版本)
-
Ruffle是一个适用于WindowsPC的FlashPlayer模拟器,用Rust编写。Ruffle作为一个独立的应用程序在所有现代操作系统上原生运行,并通过使用WebAssembly在所有现代...
- 支持终身免费4G流量,星星充电7kW星际智能交流充电桩拆解
-
前言近期星星充电推出了一款星际智能交流充电桩,在正面设有灯条,可根据灯条颜色和显示直观了解充电状态,并设有屏幕显示充电状态和ui表情。充电桩支持220V/7kW充电功率,适配主流新能源车型。并支持终身...
- 乐动随心之fancy pop(乐动随心壶多少钱一个)
-
跳动飞扬的音符像是连通人与人之间心电感应的通关密码,融化陌生,拉近彼此。此次我们邀请到宅男女神江语晨,化身音乐精灵。在歌手、演员身份间游刃自如的她,为我们生动诠释了三种不同的音乐时尚风格,娴静可爱,灵...
- Asus Zenflash 手机也能玩引闪,从此相机是路人
-
在讲解Zenflash之前,不得不提索爱的K750c,这个机器采用了氙气闪光灯,让手机的拍摄上了档次,可玩性更高,不过,说实话,当时手机的摄像头像素低,成像一般,没有掀起太大的波澜,可现在,手机的Cm...
- Axure有哪些鲜为人知的使用技巧?(axure的使用教程)
-
阿拓带你飞:不管是想入门产品经理还是已经是PM的人对AXURE都很关注,它是制作产品原型的重要工具,但是有多少人了解AXURE的使用技巧?本文是来自“知乎问答”整理的回答,一起来看看那些不常用的使用技...
- 挑战黑夜 华硕ZenFlash氙气闪光灯评测
-
【机锋配件】说到摄影,相信许多朋友都非常喜欢,不管是外出游玩拍拍风景,还是和朋友之间聚会,都会掏出手机拍两张,在餐前拍照晒朋友圈更是成为了许多用户的日常爱好,就算不是专业的摄影爱好者,大家也都有一颗热...
- WPS 演示倒计时 3 步设置!从数字动画到进度条全场景教程
-
做PPT时想添加倒计时却找不到入口?WPS演示自带的"动画+计时"功能就能轻松实现——无论是课堂互动的30秒答题倒计时、商务汇报的5分钟限时讲解,还是活动暖场的动...
- flash动画an制作MG动画元素如何调节透明度,小白...
-
如何在flash动画软件里面调节mg动画元素的透明?因为flash动画软件现在已经升级为flash动画软件,所以直接用新版flash动画软件开工,基本功能都差不多,只是flash增加很多智能化、人性...