基于图片对比的页面自动化测试实践

1.背景

背景

收到邀请，去参加北京NCTS云测试行业峰会-技术专场，准备将图片对比在测试自动化领域的实践分享给大家，本文作为分享议题的概述版本，供大家查看。

1.1 软件公司 VS 互联网公司

从软件发布来看软件公司与互联网公司的差异。

1.2 QA 的职责
1.2.1 软件公司
在软件公司，QA 的职责包括：

研发环节的最后一环；
在研发过程以尽可能多的发现 Bug 作为主要职责，在发布后以 0 Bug 作为主要目标；
流程的推动者、权限的制约者。

1.2.2 互联网公司
在互联网公司，QA 的职责包括：

全流程的质量体系；
工具平台的发起者、创造者；
捍卫真实的用户体验。

1.3 实时质量
实时质量的定义是”运行含测试，实时可反馈”

一句话总结来说就是：将质量手段以模块、组件乃至系统化的方式嵌入到业务型应用中。从代码的纬度来看：

开发写的代码是为业务特性服务的代码；
测试写的代码是为业务质量服务的代码。

1.4 无人值守自动化
无人值守自动化的定位是：基于变更，提供全流程、多样化、智能化的无人值守诊断能力，做到质量的实时反馈。

全流程看护

变更前（预发阶段）

变更中（灰度阶段）

变更后（上线阶段

覆盖所有变更

代码类变更

配置类变更

DB 变更

多维度诊断

自动化诊断

业务监控诊断

业务日志诊断

发布门禁
发布准入

预发阶段和灰度阶段发布卡口

1.5 高频集成的现状
目前我们 BU 在并行的开发着多个特性，每个特性创建了不同的分支，很难在一个相同的时间点进行统一的持续集成，多个分支可以自由的集成和发布，处于高频集成的状态。这也为回归测试带来了极大的挑战。

1.6 BU 的分层自动化模型
我们 BU 的分层自动化模型共分 4 层，展示层、接口层、服务层、数据层，每一层在不同的执行阶段与左侧的自动化框架&平台对接。层级越高，稳定性越差，自动化的效果越好。在生产运行阶段进行故障诊断和线上压测；预发布阶段进行运营 CMS 变更和预发布自动化；开发/功能调试阶段进行无线组件和适配测试。

1.7 MyDiff
MyDiff 是一个零成本配置的截图对比自动化平台

包含了以下特性：成本低、预发布拦截、全屏与区域截图、自定义的前置操作、多浏览器、多语言。

2.概述

2.1 业务与能力
从左侧来看，对接了 GAEA、TESLA 等自动化平台和 AONE 研发协同平台，PI 为算法平台，为我们提供了算法能力。

MyDiff 目前服务了 10 个 BU，产品能力包含任务管理、结果管理、执行机管理、数据统计、告警通知、平台对接等。

核心能力为截图能力和对比能力。截图能力包含对环境、登录、区域、前置操作的管理；对比能力分为像素级和非像素级两种，提供了相似度评估和差异标定。目前应用的场景包括页面回归测试、页面巡检、页面异常检测、适配测试，还有更多的场景等待探索。

2.2 自动化流程体系
自动化测试构建在协同平台 aone 的发布流程中，在开发提交代码进行预发布后，会同时进行 STC 安全扫描、CodeReview 和自动化测试等处理。盖亚接收到 aone 的消息通知，通过分层进行自动化框架的任务调度，待自动化执行完毕，将执行结果进行反馈，通知 aone。如果自动化执行失败，可以通过配置决定是否卡发布。

3.实践

3.1 技术架构
用户通过 web 集群来进行操作，如任务管理、任务执行等。MyDiff 为分布式应用，所以需要一个共享存储层，包含 mysql、oss 等存储。整个平台通过 RocketMQ 的消息进行通信，用户在 web 创建任务后，会将其包装成 captureTask，该任务控制执行机集群进行截图操作，待截图完成后，封装成 imgDiffTask，在图片对比集群进行对比操作，完成对比后更新任务状态，用户可查到报告结果。

3.2 图片对比算法优化
MyDiff 在常规方案中加入了形态学的一些算法操作，在获取像素差值图后，对差值图首先进行形态学膨胀处理，将分散的差值像素点膨胀成一个个连通区域。为避免膨胀后差异区域扩大，在形成连通区域后再对其进行形态学腐蚀。这样就能将原本分散的像素点或小区域，融合成一个个连通区域，差异区域的标记也更加友好。原本一串文本不同，通用算法会标记出多个区域，由于字符间欧式距离很小融合后会形成完整的一个连通区域。差异区域融合后，后续模板匹配的性能与精准性也会更好。