图为华中农业大学的校门和利用边缘检测算法绘出的勾线版校门效果图。 (图片由作者提供) |
不同于人脑的图像识别与记忆系统,以二进制为底层逻辑的电脑,在处理图像时应用了一套全新的运算方式——矩阵。
人脑对于图像的存储更多的是直接记忆图片,对于图片有完整的理解,而在计算机系统中,一张张图像的数据其实是一个个矩阵,这些矩阵记录着一幅幅图像的信息。但是,计算机无法直接理解一个个矩阵,需要运用矩阵的运算,引用数学的方式处理与分析图像。
计算机存储图像采用一一对应的方式,图像的每一个像素点对应组成数字图像矩阵的一个数值。根据存储方式的不同,计算机系统中的图像也分为不同的类别。最广泛应用的有二值图像、灰度图像和彩色图像。
二值图像由0与1构成的矩阵组成,0表示黑而1表示白。
灰度图像顾名思义,是由黑白灰组成的图像,为了提升运算与存储的效率,省略掉了彩色的部分,将颜色由明暗划分为不同的灰度。由0到255,这256个像素灰度可以用一个矩阵表现相对丰富的信息。
彩色图像是最接近真实的图像,每个像素点的颜色由红绿蓝三个通道组成,每个通道由0到255,表示不同明暗的颜色,三种颜色混合,模拟真实的色彩。
图像的处理涉及矩阵的计算,比如最常见的滤波操作。从效果上看,它可以模糊图像,使图像灰度变化平缓,用于缓解噪声对图像产生的影响。根据不同的数学原理,滤波器具有不同的种类,分为对像素进行计算的线性滤波与对像素进行逻辑计算的非线性滤波。
图像的分析也是一种非常有趣的矩阵算法,比如以最常见的边缘检测算法为例。它的实现原理分为4个步骤:噪声会影响边缘检测的准确性,因此首先要利用滤波操作将图像的噪声过滤掉;计算矩阵梯度的幅度与方向;对矩阵进行进一步的处理,去除不是边缘的成分;确定边缘,使用双阈值算法确定最终的边缘信息。
除了这些常见的操作,矩阵当然还有各种拓展的应用,在人工智能逐步普及的今日,它在各个领域发展着自身奇特的能力。这些数字组成的方阵,在人为赋予的意义与数学的加持下,拥有了传递信息的能力。从数字到文本,从文本到图像。这些看似杂乱无章的字符,却承载着无穷的信息。我们有理由相信,在未来,矩阵还会进一步展现自己的魅力。正所谓“万物皆数”,也许有朝一日,人类世界中所有的现象,都可以用这些美丽的数学语言表述。
(作者系华中农业大学沈婧芳名师工作室成员)