AI在可用性测试中表现出比人类更高的稳定性
近期MeasuringU发布了一项研究,旨在评估AI在分析可用性测试视频并识别问题方面的可靠性。此前,该机构已进行过相关研究,证实AI能够从视频中有效找出可用性方面的缺陷。然而,本次研究的重点在于探讨AI分析的一致性——当同一AI模型被要求对同一视频进行四次独立分析时,每次生成的可用性问题列表是否相同?如果结果不一致,那么“AI代看视频”的应用价值将大打折扣,因为它缺少了关键的稳定性保障。研究人员选取了一段时长15秒的可用性测试视频。视频内容模拟了在OpenTable上预订丹佛寿司餐厅的场景。尽管任务看似