大家好,又见面了,我是你们的朋友全栈君。
截图识别文字
作者
万开国[acewan]
【摘要】
本文主要介绍了使用pyHook、pythoncom、pytesseract、PIL、win32api等module实现python的截图识别文字功能。
【正文】
一准备及介绍
1.pyhook
pyHook通过pip直接安装比较困难,可以先下载whl文件再使用pip安装
选择与python环境一致的文件下载,使用cmd导向到下载文件夹,执行安装即可
其他module直接在控制台使用pip命令安装即可
2.module介绍
Pyhook:用于windows平台,监听鼠标和键盘事件,
:提供了访问win32 api的能力
Pytesseract:基于google’s Tesseract-OCR的独立封装包
PIL:平台上的图像处理标准库
Win32api:封装windows win32 api额模块
二具体代码
# coding: utf8
import pyHook
import pythoncom
import pytesseract
import sys
from PIL import Image, ImageGrab
from win32api import GetSystemMetrics as
gsm
#提前绑定鼠标位置事件
old_x, old_y = 0, 0
new_x, new_y = 0, 0
full = False
hm = None
chinese = True
#图片识别文字方法,
def GetString(fileName):
#
print(imagePath)
if(chinese):
text = pytesseract.image_to_string(Image.open(fileName), lang=’chi_sim’)
else:
text = pytesseract.image_to_string(Image.open(fileName))
fl = open(‘Testxt.txt’, ‘w’)
fl.write(text)
fl.close()
print(text)
return
def on_mouse_event(event):
global old_x, old_y, new_x, new_y, full, hm
if full:
image = ImageGrab.grab((0, 0, gsm(0), gsm(1)))
else:
#鼠标左键按下时,记录当前鼠标位置为截图矩形对角线的起始点
if event.MessageName == “mouse left down”:
old_x, old_y = event.Position
#鼠标左键抬起时,记录当前位置为截图矩形对角线的结束点
if event.MessageName == “mouse left up”:
new_x, new_y = event.Position
#解除事件绑定
hm.UnhookMouse()
hm = None
image = ImageGrab.grab((old_x, old_y, new_x, new_y))
fiName=’printscreen.jpg’
image.save(fiName)
GetString(fiName)
if event.MessageName == “mouse left down”:
sys.exit()
return
def capture():
#创建钩子管理对象
hm = pyHook.HookManager()
#将已准备好的方法注册到鼠标事件
hm.SubscribeMouseAll(on_mouse_event)
#开始监听鼠标事件
hm.HookMouse()
#一直监听直到退出程序
pythoncom.PumpMessages()
capture()
三效果展示
截图效果:
转文字效果:
发布者:全栈程序员-用户IM,转载请注明出处:https://javaforall.cn/132551.html原文链接:https://javaforall.cn
【正版授权,激活自己账号】: Jetbrains全家桶Ide使用,1年售后保障,每天仅需1毛
【官方授权 正版激活】: 官方授权 正版激活 支持Jetbrains家族下所有IDE 使用个人JB账号...