0、项目介绍

这次使用cvzone模块,制作一个虚拟拖拽系统,我们根据索引可以知道食指与中指的索引为8和12,当两指间合并时可以对虚拟方块进行拖拽,张开时解除拖拽,方块停在此处。虽然目前仍然存在一定的bug,即当两个虚拟方块重合较多时,会使其中的一个方块消失,但我们又能利用这一点可以制作计算机视觉方面的游戏,比如贪吃蛇等。

1、效果展示

2、项目搭建

本次项目依赖于视觉方面优秀的第三方库:

pip install cvzone

pip install mediapipe

除此之外,只需要一个.py文件就能完成本次项目。

更新cvzone的方法:

打开pycharm中的设置,找到cvzone:

3、项目代码展示与讲解

block.py

import cv2from cvzone.HandTrackingModule import HandDetectorimport cvzoneimport numpy as npcap = cv2.VideoCapture(1)cap.set(3, 1280)cap.set(4, 720)detector = HandDetector(detectionCon=0.8)colorR = (0, 0, 255)cx, cy, w, h = 100, 100, 200, 200class Moveblock():    def __init__(self,posCenter,size=(200,200)):        self.posCenter=posCenter        self.size=size    def update(self,cursor):        cx,cy=self.posCenter        w,h=self.size        if cx - w // 2 < cursor[0] < cx + w // 2 and \                cy - h // 2 < cursor[1] < cy + h // 2:            self.posCenter = cursor[:2]rectList=[]for i in range(5):    rectList.append(Moveblock((i*250+150,150)))while True:    succes,img=cap.read()    img = cv2.flip(img,1)    lmList ,img = detector.findHands(img)    # print(lmList)    if lmList:        lmList1 = lmList[0]["lmList"]        length, info, img = detector.findDistance(lmList1[8][:2],lmList1[12][:2],img,draw=False)        print(length)        if length<60:            # lmList1 = lmList[0]["lmList"]            cursor = lmList1[8]            # print(cursor)            for rect in rectList:                rect.update(cursor)    #实体框    # for rect in rectList:    #     cx, cy = rect.posCenter    #     w, h = rect.size    #     cv2.rectangle(img,(cx-w//2,cy-h//2),(cx+w//2,cy+h//2),colorR,cv2.FILLED)    #    #     cvzone.cornerRect(img,(cx-w//2,cy-h//2, w, h),20,rt=0)    #半透明    imgNew=np.zeros_like(img,np.uint8)    for rect in rectList:        cx, cy = rect.posCenter        w, h = rect.size        cv2.rectangle(imgNew,(cx-w//2,cy-h//2),(cx+w//2,cy+h//2),colorR,cv2.FILLED)        cvzone.cornerRect(imgNew,(cx-w//2,cy-h//2, w, h),20,rt=0)    out = img.copy()    alpha=0.3    mask=imgNew.astype(bool)    out[mask]=cv2.addWeighted(img,alpha,imgNew,1-alpha,0)[mask]    cv2.imshow("Image", out)    k=cv2.waitKey(1)    if k==27:break

本次依旧还是我来讲解,本次项目实现的思路吧。

  • 首先,配置摄像头这些讲过很多次了,相信大家应该也是“a piece of cake”,在cvzone包中有名为HandTrackingModule的模块,它其中其实是一个类,名为HandDetector,提高置信度,让检测到我们的手更准确。
  • 其次,cv2.flip(img,1),表示的是水平翻转图像,为什么有这一步呢?比如打开手机的前置摄像头,从我们的视线上来看,图像是保持对称的,而当我们面临摄像头时,它是相反的,即我的手向右移动,而窗口中却向左移。HandDetector下右findHands,draw参数的布尔值会返回不同的值,需要注意,你是否想要这个手势检测的边界框。在findDistance中,本来cvzone没有draw参数,我是自己添加的,当你要修改的时候,会弹出一个框是否让要修改,不怕我已经修改好了,大家把下面的复制覆盖原来的函数就好了,还有一点就是我的cvzone是最新版本的,在1.4.1及其以前有所不同,具体还是要看看里面的函数,但对于本项目,如果你只想使用,大家最好更新至1.5.6。
    def findDistance(self, p1, p2, img=None,draw=True):        """        Find the distance between two landmarks based on their        index numbers.        :param p1: Point1        :param p2: Point2        :param img: Image to draw on.        :param draw: Flag to draw the output on the image.        :return: Distance between the points                 Image with output drawn                 Line information        """        x1, y1 = p1        x2, y2 = p2        cx, cy = (x1 + x2) // 2, (y1 + y2) // 2        length = math.hypot(x2 - x1, y2 - y1)        info = (x1, y1, x2, y2, cx, cy)        if img is not None:            if draw:                cv2.circle(img, (x1, y1), 15, (255, 0, 255), cv2.FILLED)                cv2.circle(img, (x2, y2), 15, (255, 0, 255), cv2.FILLED)                cv2.line(img, (x1, y1), (x2, y2), (255, 0, 255), 3)                cv2.circle(img, (cx, cy), 15, (255, 0, 255), cv2.FILLED)            return length, info, img        else:            return length, info
  • 然后,得到了两指尖的距离,打印出来显示一个合适的范围,摄像头距离会有所影响。接着建立类Moveblock用来创建我们的方块,其中被我注释掉的一部分,就是实心的方块,但我觉得添加一个半透明的方块可能更有意思。
  • 最后,显示窗口,展示我们的项目。

4、项目资源

GitHub:Opencv-project-training/Opencv project training/16 Virtual drag block at main · Auorui/Opencv-project-training · GitHub

5、项目总结

本次的项目还是有点小缺点,当两个方块重合太多时,会让另外的虚拟方块消失,目前还没有解决,但利用这个bug,也还是可以做一些其他项目,比如碰到另外的物体,被触的物体消失,这个想法我觉得运用还是挺多的。