python获取图片像素

发布时间: 2023-07-06 19:56:15

‘壹’ 您好，请问怎么用python写程序关于计算八张图片的像素平均值并将其放到

每张图像是一个二维矩阵（灰度图像）或者三维张量（彩色图像）。计算均值的话可以用

importnumpyasnp
np.mean()

这个函数的功能可以查看你的python库，help(np)即可（或者help(numpy)）。

‘贰’ python处理图片数据

目录

1.机器是如何存储图像的？

2.在Python中读取图像数据

3.从图像数据中提取特征的方法#1：灰度像素值特征

4.从图像数据中提取特征的方法#2：通道的平均像素值

5.从图像数据中提取特征的方法#3：提取边缘
是一张数字8的图像，仔细观察就会发现，图像是由小方格组成的。这些小方格被称为像素。

但是要注意，人们是以视觉的形式观察图像的，可以轻松区分边缘和颜色，从而识别图片中的内容。然而机器很难做到这一点，它们以数字的形式存储图像。请看下图：

机器以数字矩阵的形式储存图像，矩阵大小取决于任意给定图像的像素数。

假设图像的尺寸为180 x 200或n x m，这些尺寸基本上是图像中的像素数（高x宽）。

这些数字或像素值表示像素的强度或亮度，较小的数字（接近0）表示黑色，较大的数字（接近255）表示白色。通过分析下面的图像，读者就会弄懂到目前为止所学到的知识。

下图的尺寸为22 x 16，读者可以通过计算像素数来验证：

图片源于机器学习应用课程

刚才讨论的例子是黑白图像，如果是生活中更为普遍的彩色呢？你是否认为彩色图像也以2D矩阵的形式存储？

彩色图像通常由多种颜色组成，几乎所有颜色都可以从三原色（红色，绿色和蓝色）生成。

因此，如果是彩色图像，则要用到三个矩阵（或通道）——红、绿、蓝。每个矩阵值介于0到255之间，表示该像素的颜色强度。观察下图来理解这个概念：

图片源于机器学习应用课程

左边有一幅彩色图像（人类可以看到），而在右边，红绿蓝三个颜色通道对应三个矩阵，叠加三个通道以形成彩色图像。

请注意，由于原始矩阵非常大且可视化难度较高，因此这些不是给定图像的原始像素值。此外，还可以用各种其他的格式来存储图像，RGB是最受欢迎的，所以笔者放到这里。读者可以在此处阅读更多关于其他流行格式的信息。

用Python读取图像数据

下面开始将理论知识付诸实践。启动Python并加载图像以观察矩阵：

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
%matplotlib inline
from skimage.io import imread, imshow
image = imread('image_8_original.png', as_gray=True)
imshow(image)

#checking image shape
image.shape, image

（28，28）

矩阵有784个值，而且这只是整个矩阵的一小部分。用一个LIVE编码窗口，不用离开本文就可以运行上述所有代码并查看结果。

下面来深入探讨本文背后的核心思想，并探索使用像素值作为特征的各种方法。

方法#1：灰度像素值特征

从图像创建特征最简单的方法就是将原始的像素用作单独的特征。

考虑相同的示例，就是上面那张图（数字‘8’），图像尺寸为28×28。

能猜出这张图片的特征数量吗？答案是与像素数相同！也就是有784个。

那么问题来了，如何安排这784个像素作为特征呢？这样，可以简单地依次追加每个像素值从而生成特征向量。如下图所示：

下面来用Python绘制图像，并为该图像创建这些特征：

image = imread('puppy.jpeg', as_gray=True)

image.shape, imshow(image)

（650，450）

该图像尺寸为650×450，因此特征数量应为297,000。可以使用NumPy中的reshape函数生成，在其中指定图像尺寸：

#pixel features

features = np.reshape(image, (660*450))

features.shape, features

(297000,)
array([0.96470588, 0.96470588, 0.96470588, ..., 0.96862745, 0.96470588,
0.96470588])

这里就得到了特征——长度为297,000的一维数组。很简单吧？在实时编码窗口中尝试使用此方法提取特征。

但结果只有一个通道或灰度图像，对于彩色图像是否也可以这样呢？来看看吧！

方法#2：通道的平均像素值

在读取上一节中的图像时，设置了参数‘as_gray = True’，因此在图像中只有一个通道，可以轻松附加像素值。下面删除参数并再次加载图像：

image = imread('puppy.jpeg')
image.shape

(660, 450, 3)

这次，图像尺寸为（660，450，3），其中3为通道数量。可以像之前一样继续创建特征，此时特征数量将是660*450*3 = 891,000。

或者，可以使用另一种方法：

生成一个新矩阵，这个矩阵具有来自三个通道的像素平均值，而不是分别使用三个通道中的像素值。

下图可以让读者更清楚地了解这一思路：

这样一来，特征数量保持不变，并且还能考虑来自图像全部三个通道的像素值。

image = imread('puppy.jpeg')
feature_matrix = np.zeros((660,450))
feature_matrix.shape

(660, 450)

现有一个尺寸为（660×450×3）的三维矩阵，其中660为高度，450为宽度，3是通道数。为获取平均像素值，要使用for循环：

for i in range(0,iimage.shape[0]):
for j in range(0,image.shape[1]):
feature_matrix[i][j] = ((int(image[i,j,0]) + int(image[i,j,1]) + int(image[i,j,2]))/3)

新矩阵具有相同的高度和宽度，但只有一个通道。现在，可以按照与上一节相同的步骤进行操作。依次附加像素值以获得一维数组：

features = np.reshape(feature_matrix, (660*450))
features.shape

(297000,)

方法#3：提取边缘特征

请思考，在下图中，如何识别其中存在的对象：

识别出图中的对象很容易——狗、汽车、还有猫，那么在区分的时候要考虑哪些特征呢？形状是一个重要因素，其次是颜色，或者大小。如果机器也能像这样识别形状会怎么样？

类似的想法是提取边缘作为特征并将其作为模型的输入。稍微考虑一下，要如何识别图像中的边缘呢？边缘一般都是颜色急剧变化的地方，请看下图：

笔者在这里突出了两个边缘。这两处边缘之所以可以被识别是因为在图中，可以分别看到颜色从白色变为棕色，或者由棕色变为黑色。如你所知，图像以数字的形式表示，因此就要寻找哪些像素值发生了剧烈变化。

假设图像矩阵如下：

图片源于机器学习应用课程

该像素两侧的像素值差异很大，于是可以得出结论，该像素处存在显着的转变，因此其为边缘。现在问题又来了，是否一定要手动执行此步骤？

当然不！有各种可用于突出显示图像边缘的内核，刚才讨论的方法也可以使用Prewitt内核（在x方向上）来实现。以下是Prewitt内核：

获取所选像素周围的值，并将其与所选内核（Prewitt内核）相乘，然后可以添加结果值以获得最终值。由于±1已经分别存在于两列之中，因此添加这些值就相当于获取差异。

还有其他各种内核，下面是四种最常用的内核：

图片源于机器学习应用课程

现在回到笔记本，为同一图像生成边缘特征：

#importing the required libraries
import numpy as np
from skimage.io import imread, imshow
from skimage.filters import prewitt_h,prewitt_v
import matplotlib.pyplot as plt
%matplotlib inline

#reading the image
image = imread('puppy.jpeg',as_gray=True)

#calculating horizontal edges using prewitt kernel
edges_prewitt_horizontal = prewitt_h(image)
#calculating vertical edges using prewitt kernel
edges_prewitt_vertical = prewitt_v(image)

imshow(edges_prewitt_vertical, cmap='gray')

‘叁’ 为什么用Python的openCV读取图片与PIL读取的图片像素值会不一样

经测试，同一张图片，使用 PIL和 OpenCv库读取的数据是一样的（经过BGR转成RGB）：

建议：可以尝试更新 PIL或是 OpenCv库。

本机测试环境： Python 3.7+Pillow 6.2 +opencv-python 4.1

‘肆’ 怎样利用Python进行图片分析

fromPILimportImage###此处为导出包，注意字母大小写
importos,os.path

#指明被遍历的文件夹
rootdir=os.path.abspath(os.curdir)+'/Image/'
rootdir1=os.path.abspath(os.pardir)+"/Image/"

#打包用
ifos.path.isdir(rootdir):
pass
else:
rootdir=rootdir1

size=315,560
i=0

forparent,dirnames,filenamesinos.walk(rootdir):
forfilenameinfilenames:
infile=os.path.join(parent,filename)
im=Image.open(infile)###此处Image.open(dir)为多数对象应用的基础.
im.thumbnail(size)###此处size为长度为2的tuple类型，改变图片分辨率
im.save(infile)###im.save(dir)，图片处理的最后都用这个，就是保存处理过后的图片
i+=1
print(i,"Done")

要用pil包安装如下：pipinstallpillow

‘伍’ Python 的题

from selenium import webdriver # 用来驱动浏览器的from selenium.webdriver import ActionChains # 破解滑动验证码的时候用的可以拖动图片import timefrom PIL import Image # pip3 install pillowimport random# 截图图片函数def cut_image(driver): # 获取整个页面图片，图片名字为'snap.png'
driver.save_screenshot('snap.png') # 获取滑动小画图
image = driver.find_element_by_class_name('geetest_canvas_img') print(image.location) print(image.size) # 获取小图片的左上右下的位置
left = image.location['x']
top = image.location['y']
right = left + image.size['width']
buttom = top + image.size['height'] print(left, top, right, buttom) # 调用open方法打开全屏图片并赋值给image_obj对象
image_obj = Image.open('snap.png') # 通过image_obj对象对小图片进行截取
# box: The crop rectangle, as a (left, upper, right, lower)-tuple.
img = image_obj.crop((left, top, right, buttom)) # 打开截取后的小图片
# img.show()
return img# 获取完整图片def get_image1(driver):
time.sleep(2) # 修改document文档树，把完整图片的display属性修改为block
js_code = '''
var x = document.getElementsByClassName("geetest_canvas_fullbg")[0].style.display = "block"; '''

# 执行js代码 driver.execute_script(js_code) # 截取图片
image = cut_image(driver) return image# 获取有缺口图片def get_image2(driver):
time.sleep(2) # 修改document文档树，把完整图片的display属性修改为block
js_code = '''
var x = document.getElementsByClassName("geetest_canvas_fullbg")[0].style.display = "none"; '''

# 执行js代码 driver.execute_script(js_code) # 截取图片
image = cut_image(driver) return image# 获取滑块滑动距离def get_distance(image1, image2): # 小滑块右侧位置
start = 60 # 像素差
num = 60 print(image1.size) for x in range(start, image1.size[0]): for y in range(image1.size[1]): # 获取image1完整图片每一个坐标的像素点
rgb1 = image1.load()[x, y] # 获取image2缺口图片每一个坐标的像素点
rgb2 = image2.load()[x, y] # (60, 86, 40) (60, 86, 40) rgb
print(rgb1, rgb2) # abs获取绝对值，像素点比较的值
r = abs(rgb1[0] - rgb2[0])
g = abs(rgb1[1] - rgb2[1])
b = abs(rgb1[2] - rgb2[2]) # 如果条件成立，则找到缺口位置
if not (r < num and g < num and b < num): # 有误差 - 7像素
return x - 7# 模拟人的滑动轨迹def get_strck_move(distance):
distance += 20 '''
滑动行为轨迹
加速公式:
v = v0 + a * t

路程公式:
s = v0 * t + 0.5 * a * (t ** 2) '''

# 初速度
v0 = 0 # 时间
t = 0.2 # 位置
s = 0 # 滑动轨迹列表向前滑动列表
move_list = [] # 中间值,作为加减速度的位置
mid = distance / 5 * 3 # 加减速度列表
v_list = [1, 2, 3, 4] # 循环位移
while s < distance: if s < mid: # 随机获取一个加速度
a = v_list[random.randint(0, len(v_list) - 1)] else: # 随机获取一个减速度
a = -v_list[random.randint(0, len(v_list) - 1)] '''
匀加速\减速运行
v = v0 + a * t

位移:
s = v * t + 0.5 * a * (t**2) '''
# 获取初始速度
v = v0 # 路程公式:
s1 = v * t + 0.5 * a * (t ** 2)
s1 = round(s1) # 取整

# 加速公式:
# v = v0 + a * t
m_v = v + a * t # 把当前加/减速度赋值给初始速度，以便下一次计算
v0 = m_v # 把位移添加到滑动列表中 move_list.append(s1) # 修改滑动初始距离
s += s1 # 后退列表, 自定义后退滑动轨迹,必须是负值
back_list = [-1, -1, -2, -3, -2, -1, -1, -2, -3, -2, -1, -1] return {'move_list': move_list, 'back_list': back_list}def main():
driver = webdriver.Chrome(r'F:\python学习\Scripts\chromedriver')
driver.implicitly_wait(10) try:
driver.get('https://account.cnblogs.com/signin?returnUrl=https%3A%2F%2Fwww.cnblogs.com%2F') # 1、输入用户名与密码，并点击登录
user_input = driver.find_element_by_id('LoginName')
user_input.send_keys('你的博客园账号')
time.sleep(0.2)

pwd_input = driver.find_element_by_id('Password')
pwd_input.send_keys('你的博客园密码')
time.sleep(2)

login_submit = driver.find_element_by_id('submitBtn')
login_submit.click() # 2、获取完整的图片
image1 = get_image1(driver) # 3、获取有缺口图片
image2 = get_image2(driver) # 4、比对两张图片，获取滑动距离
distance = get_distance(image1, image2) print(distance) # 5、模拟人的滑动轨迹
move_dict = get_strck_move(distance) # 获取前进滑动轨迹
move_list = move_dict['move_list'] # 获取后退滑动轨迹
back_list = move_dict['back_list'] # 6、开始滑动
move_tag = driver.find_element_by_class_name('geetest_slider_button') # 点击摁住滑动按钮 ActionChains(driver).click_and_hold(move_tag).perform() # 向前滑动
for move in move_list:
ActionChains(driver).move_by_offset(xoffset=move, yoffset=0).perform()
time.sleep(0.1)

time.sleep(0.1) # 向后滑动
for back in back_list:
ActionChains(driver).move_by_offset(xoffset=back, yoffset=0).perform()
time.sleep(0.1) # 制作微妙晃动
ActionChains(driver).move_by_offset(xoffset=3, yoffset=0).perform()
ActionChains(driver).move_by_offset(xoffset=-3, yoffset=0).perform()

time.sleep(0.1) # 释放滑动按钮 ActionChains(driver).release().perform()

time.sleep(100) finally:
driver.close()if __name__ == '__main__':
main()

阅读全文

热点内容

scratch少儿编程课程发布：2025-04-16 17:11:44 浏览：640

荣耀x10从哪里设置密码发布：2025-04-16 17:11:43 浏览：368

java从入门到精通视频发布：2025-04-16 17:11:43 浏览：86

php微信接口教程发布：2025-04-16 17:07:30 浏览：310

android实现阴影发布：2025-04-16 16:50:08 浏览：794

粉笔直播课缓存发布：2025-04-16 16:31:21 浏览：346

机顶盒都有什么配置发布：2025-04-16 16:24:37 浏览：213

编写手游反编译都需要学习什么发布：2025-04-16 16:19:36 浏览：817

proteus编译文件位置发布：2025-04-16 16:18:44 浏览：367

土压缩的本质发布：2025-04-16 16:13:21 浏览：594

python获取图片像素

与python获取图片像素相关的资讯