文献&案例
眼球运动
日期:2023-04-07 浏览次数:

眼球运动的解剖学

我们的眼球运动范围取决于眼睛的解剖结构,即视网膜中锥体细胞的分布使得视觉敏锐度(我们的视力清晰)中央凹区域视力最为清晰。因此,我们需要能够快速地将我们的中心凹区域定位到空间中潜在的信息区域,并在到达那里时保持我们的眼睛在原地(保持该区域中心凹),以便处理视觉输入。此外,我们需要能够跟踪移动的东西,并补偿我们自己头部的移动。这些要求决定了我们可以进行的眼球运动类型,所有这些运动都由三对眼外肌控制。

 

眼球运动类型

以下部分描述了眼球跟踪研究人员感兴趣的主要不同类型的眼球运动。

眼跳/眼跳运动

Saccade Animation

19世纪80年代,Javal首次使用法语动词saccade(意为“急促”)中的术语来描述眼球运动。它指的是当我们将中央凹区域重新定位到一个新的空间位置时,我们做出的非常快速的共轭(双眼做相同的事情)眼球运动。我们通常每秒进行3次左右的扫视。扫视通常被描述为“弹道”运动,这意味着一旦发射,其弹道就无法改变。事实证明,这在某种程度上是正确的……也许就眼球追踪而言,更重要的是,人们通常认为我们在扫视时“实际上是失明的”。同样,这也证明是正确的,但在计算停留时间等度量时,通常忽略扫视持续时间。许多眼球追踪研究人员最感兴趣的是知道他们在看什么,看了多长时间,而不太关心眼跳本身。

不过,对于一些研究人员来说,眼跳可能是一个非常丰富的信息来源,常见的指标包括潜伏期、幅度、方向和峰值速度(见下图)。振幅和速度与所谓的“主序列”有关——较大的眼跳具有较高的峰值速度。虽然在凝视数据的“凝视叠加”可视化中,扫视通常由直线表示,但扫视轨迹通常明显弯曲,这是研究人员感兴趣的另一种测量方法。

Common Saccade Metrics

也许扫视最令人困惑的是它应该如何发音……两个音节的重音可以均匀,或者重音可以出现在第二个音节上。“ade”音节可以读作lemonade,也可以读作hard或mad。根据我的经验,这些不同的发音在眼球追踪研究人员中似乎分布得相当均匀,而且都是完全可以接受的!

固定装置

扫视通常在注视之前和之后进行,该术语用于描述视觉信息处理的相对稳定期。研究人员(和眼睛跟踪软件)用来确定眼睛是处于注视状态还是处于扫视状态的规则和算法可能很复杂,将在另一个博客中讨论。固定时间通常为200-300ms,但可以短得多,也可以长得多,平均固定时间在一定程度上取决于上下文,例如,阅读时的固定时间通常比观看场景时的固定时间短。研究人员在分析阶段通常会关注注视,尤其是当凝视被用作“注意力”的代表时。固定通常由两个关键指标描述:它们的位置(定义为它们包含的样本的平均x和y位置)及其持续时间。在标准的可视化方法中,固定由圆表示,圆的中心位于平均x、y位置,其直径反映持续时间。将兴趣区域内的注视持续时间相加,得出“停留时间”。

Fixations

令人困惑的是,虽然扫视和扫视眼动是同一回事,但注视和注视眼动却不是(见下文)。

微痉挛/(内)注视眼动

将固定点表示为具有固定位置的圆圈可以给人留下这样的印象,即眼睛在固定过程中完全静止。事实上,眼睛从来都不是真正静止的——在注视中,可能会出现“漂移”(位置的缓慢变化)和微痉挛。正如他们的名字所暗示的那样,微痉挛就像正常的扫视一样,只是更小。一次扫视必须有多小才能算作一次微扫视是一个相当有争议的话题,但小于1度的视角是一个相当常见的界限。研究人员对它们感兴趣的原因有很多。它们的频率和方向可能为注意过程提供有用的见解,并且它们是脑电图/脑磁图甚至功能磁共振成像记录中的潜在噪声源。为了能够检测到微加速度,您需要一个像EyeLink 1000 Plus这样的眼动跟踪器,它具有快速的采样率和非常高的精度。下图放大了屏幕中央的一个固定点。在更高的放大倍数下,可以看到一个微小的(小于0.4度)微镜头——当凝视X轴时,随着时间的推移也可以看到。

Microsaccade

由于微痉挛被认为是“固定内的”,研究人员使用了一系列专门设计的算法(如Engbert等人,2015年开发的算法)来检测微痉挛。

平稳追踪 (追随)

Smooth Pursuit Animation

如果您正在固定一个感兴趣的对象,并且该对象开始移动,那么您可能希望继续观察该对象。尝试用一系列小的眼跳和注视来跟踪移动的物体会减少可供处理的视觉信息量。物体会反复移出高视力中心凹区域,需要我们扫视到新的位置,而我们在扫视过程中基本上是失明的。相反,我们做平稳的眼球运动。你可以把它们想象成一种移动的固定物。如果你记录人们观看动态刺激(如电影)时,平滑的眼球运动是很常见的。它们在分析方面可能有点问题,因为虽然它们是“固定的”(眼睛仍然固定在移动的物体上),但像“正常”固定一样对待(或至少可视化)平稳的眼球运动没有多大意义。“正常”固定通常由单个x,y位置描述,该位置基于它们包含的样本的平均x,y坐标。绘制移动固定点的平均位置信息量不大。相反,平滑的追踪眼动最好通过绘制随时间变化的凝视位置(在样本水平上)来可视化–追踪显示为对角线轨迹(见下文),比较由注视和眼跳分别形成的水平线和(接近)垂直线。平滑追踪眼球运动的量化可能很复杂,但研究人员经常报告“速度增益”(追踪过程中眼球速度与目标速度的比率)和均方根误差(注视位置与目标位置之间的平方差的平均值的平方根)。在下面右侧的图像中,可以将速度增益视为凝视图(红色)的斜率与目标图(黑色)的斜率之比。RMSE可以被认为是这两条线之间的平均偏移量。

Smooth Pursuit

其他常见的平滑追踪指标包括追踪持续时间(追踪而非扫视或非追踪注视所花费的时间)和追踪分段数。研究人员还可以对追逐过程中发生的扫视类型感兴趣,这些类型可以分为“追赶”、“后退”和“预期”。追赶和后退扫视通常被认为是纠正性的,而预期扫视是侵入性的,在某些神经和神经精神疾病中可能会增加。

前庭眼反射(VOR)

如果你正盯着一个感兴趣的物体,而你的头在移动,那么VOR系统可以确保你的眼睛适当地调整位置。因此,如果你直视前方并向右旋转头部,你的眼睛将向左旋转,以确保物体保持固定(反之亦然)。即使是最小的头部运动,也会发生VOR运动。VOR是人类最快的反射之一,但它们是非自愿的“低水平”运动,与大多数眼球跟踪研究人员无关,尤其是那些使用基于桌面的眼球跟踪仪的研究人员。

收敛性           

Vergence Animation

绝大多数眼球运动都是共轭的(两只眼睛都朝着同一方向运动),但当我们的眼睛聚焦在一个非常近的物体上时,我们的眼睛会聚在一起(两只眼睛都向鼻侧旋转)。如果我们聚焦在远处的物体上,眼睛就会发散。对于基于屏幕的眼睛跟踪,这些辐合运动通常不是问题,因为所有刺激都显示在固定距离的单个屏幕上。对于移动/头戴式眼球跟踪,参与者可以自由地注视任何距离的物体,可以使用聚散运动来估计z维的注视。

眼球震颤/OKN

Nystagmus Animation

眼球震颤是指快速的前后眼球运动。这个词可以指一种疾病,在这种情况下,来回运动可以采取许多不同的形式。通常有一个缓慢和快速的阶段。慢速阶段可以等同于平稳的追踪,快速阶段可以等同于眼跳。视动性眼球震颤(OKN)发生于健康个体,当大部分视野连续朝同一方向移动时。你可以通过看着某人的眼睛很容易地观察到OKN,因为他们注视着一列行驶中的火车窗外。同样,一个缓慢和快速的阶段总是存在的——当凝视位置随着时间的推移绘制出来时,就会形成一个“锯齿”模式。这种眼球运动通常是关注医学状况或动眼神经控制基本机制的研究人员感兴趣的。

i

Nystagmus

从技术上讲,这些当然不是眼球本身的运动,但它们在眼球跟踪中很重要,原因有很多。当然,最重要的是,如果眼睛不可见,就无法跟踪凝视。首先,眨眼可以打断注视,在这种情况下,一个注视将作为两个单独的注视(在同一位置)出现在眼球跟踪数据中。在许多情况下,这可能不是问题——重要的是固定的持续时间和位置。使事情复杂化的是,眨眼和扫视经常结合在一起,这意味着眨眼可以掩盖实际的扫视。我们的分析软件Data Viewer提供了一系列处理眨眼的选项,包括移除或合并眨眼两侧的固定。