又叫“发声起始时间”。是语音学中的一个重要概念。VOT 从声学角度描述了传统语文学/语言学对于所谓清浊的区分。
定义:声带震动起始时间与口腔除阻时间的差。
VOT 为负值的话:反应在听觉上就是所谓的带声辅音,或浊音,
VOT 为正的话:就是不带声辅音,或清音。VOT 如果长至20ms以上被描述为不仅不带声而且还送气。
在语音学中,起音时间(VOT)是停顿辅音(consant)产生的一个特征。它被定义为从停止辅音的释放,到开始发声、声带的振动之间的时间长度,或者根据其他作者的说法,即周期性。有些作者允许负值标记在发音关闭期间开始的辅音并在释放时继续的发声,对于那些在发音关闭时没有发声的非送气的浊音停止。
-
起源
嗓音起始时间的概念可以追溯到19世纪,当Adjarian(1899: 119)[1]研究了亚美尼亚停止,并为他们的“两个时刻之间存在的关系:一个辅音时破裂口的空气被释放时,或爆炸,和一个当喉部开始振动”。然而,这个概念只是在20世纪60年代才开始“流行”,林和安培描述了当时的环境。Wang(2011: 514):[2]“当时,关于哪种语音属性可以有效地区分浊音和不浊音停顿,一直存在争论。例如,发声,渴望和发音力是一些属性被定期研究。在英语中,“表达”可以成功分离/ b, d,ɡ/ / p、t, k /停止在word-medial位置时,但这并非总是如此word-initial停止。严格地说,word-initial表示停止/ b, d,ɡ/只有部分表示,有时甚至是无声的。”VOT的概念最终在Lisker和amp的著名研究中获得了它的名称。
-
类型
可以根据声音起止时间来分析三种主要的停顿类型。
1.单纯的不送气的无声(非响音的)塞音,有时也称作无声爆破音——中文习称为全清音。其VOT长度等于或近似于零,也就是说几乎在除阻的同时,后接的响音(比如元音)即开始发音。(好比塞音[t],如果其消退时间为15ms,或者如塞音[k],30ms,则认为它们是无声爆破音)
2.后接响音的送气塞音,其VOT比全清音的要长,称作爆破VOT。爆破VOT的长度是衡量送气程度的实用指标:VOT越长,送气就越强。比如,在强送气的纳瓦霍语中,送气的持续时间是英语的两倍:[kʰ]的VOT值两者分别为160ms 和 80ms,而英语不送气[k]的VOT却只有45ms。另一些语言中也有比英语更弱的送气音。概括地说,以软颚塞为例,不送气[k]的典型VOT在20-30 ms之间,弱送气的的参考值为50
60ms,中等送气[kʰ]平均约为80
90ms,而拥有超过100ms甚至更长VOT的音则视作强送气音。呼吸音,通常也称作送气浊音,为了将VOT用作分析浊送气音的指标,须将VOT中的O——Onset(起始)——理解为开始发呼吸浊音[ɦ]的一刹那。当然,送气辅音不一定都有后续的响音,但VOT是以响音的起始来定义的,就是说在这种情况下送气的强度是不能用VOT来衡量的。
3.浊塞音的出奇之处在于它拥有小于0的VOT值,VOT的负值意味著,声带在除阻之前就开始了震动。术语完全浊塞音是指声带恰好在成阻的一刹那开始震动,而不完全浊塞音则是指在持阻阶段中的某一时刻声带开始震动。
由于送气和有声(声带震动)都不是绝对的概念,允许有不同程度的中间值存在,所以我们常常会用相对的术语“强”(fortis)和“弱”(lenis)来描述呈二元对立的两个辅音系列。将VOT高的界定为“强辅音”,将VOT低的界定为“弱辅音”。当然,强弱都是相对而言的,不同的语言里强弱的涵盖可以迥乎不同。
清浊对立可以应用于所有类型的辅音,而送气却是塞音和塞擦音才有的特征。
哪些语言上的因素会左右实际观测到的 VOT 值?
影响 VOT 值的不仅仅是各语言不同的音系,或“语音语法知识”。众所周知,语言虽然是一个具有静态结构且相对稳定的复杂系统,但是落实到话语层面,这些相对稳态的结构是需要被我们的调音器官(调音器官包括口腔内各器官和手势)执行并且输出成语音或手势(手语)信号的。调音器官的具体执行落实到生理或物理层面会受到诸多因素影响,
在语音学中,起音时间(VOT)是停顿辅音(consant)产生的一个特征。它被定义为从停止辅音的释放,到开始发声、声带的振动之间的时间长度,或者根据其他作者的说法,即周期性。有些作者允许负值标记在发音关闭期间开始的辅音并在释放时继续的发声,对于那些在发音关闭时没有发声的非送气的浊音停止。VOT,英文全称为voice onset time,中文有“嗓音起始时间”、“浊音起始时间”、“发声起始时间”、“声带震动起始时间”等各色缤纷的译法,大抵翻译仅襄阐释不做正名,称呼提举处多直引字母缩略形VOT。VOT的具体
根据语音合成与语音识别等语音应用研究的需求,从文本分析模块入手,第一次利用“维吾尔语语音声学参数库”,选择了带有塞音和塞擦音的556个双音节词,重点提取了塞音、塞擦音的位置在双音节词的词中和词尾时嗓音起始时间VOT特征参数并对此进行了统计分析,首次从实验语音学的角度提出了清塞音、清塞擦音送气、不送气的概念。通过分析得出结论:(1)利用VOT均值可以明显地把维吾尔语中的塞音、塞擦音从清浊类别上区分开来。(2)从嗓音起始时间类型上来看,清塞音出现在双音节词第二音节的音节首(词中)时表现出不送气的特点,而位置出现在第二音节的音节末(词尾)时,有时读成送气音,有时读成不送气音,根据实际情况和个人发音习惯的不同可以自由变读。研究结果对维吾尔语语音合成自然度和语音识别系统识别率的提高有非常大的作用。
上一篇博文简单介绍了vot-toolkit的使用方法。当然,那只是操作层面的东西,更重要的是我们通过这个工具得到的各种图表以及图表中的数据。而想要完整地评价一个tracker的性能,其指标必然不会过于简单,所以就有了这篇文章。我想通过梳理VOT2013到VOT2016评价指标的变化,呈现一个更加清晰的思路,让各位对VOT的认识更加深刻。
这篇文章先对VOT进行总体概述,再按照时间顺序分别叙述,循...
文章目录1.期望覆盖率1.1 A和R1.2 理想EAO1.3 标准EAO2.实际计算2.1估算EAO2.2 EAO与R的关系
看VOT竞赛报告时,经常会看到一个奇怪的现象,精度A和鲁棒性R的排名都靠前,而EAO,即期望平均覆盖率却不靠前,vice versa,这是怎么回事呢,这篇文章就来说说EAO的计算方法。
1.期望覆盖率
1.1 A和R
看上图,今年的VOT18结果,看看EAO第一的LADC...
由于我在做跟踪算法测试的时候发现vot官网可以在国内打开,但是数据集那一栏不显示,想到大家可能也和我一样缺数据集,所以我把我下载到的VOT数据集分享给大家。
链接:https://pan.baidu.com/s/10CD5D4q6WAUbYmK6If7SvQ
提取码:yiay
如果大家想赞助我点C币的话,也可以下载一个txt文件,里面也是一个百度云链接,不赞助也没关系。
注意:此百度云链接包括vo...
VOT toolkit的配置和使用(超详细)
最近需要使用在vot上测试自己的跟踪器的效果,所以需要配置vot toolkit,之前也尝试配置过但是弄了很久也没有搞定,这一次算是彻底配置好了。
1.首先我们下载官方的vot toolkit。
git clone https://github.com/votchallenge/vot-toolkit
2.下载好了vot toolkit之后我们再手动...
各种物体和场景的2.5D / 3D数据集(Ajmal Mian)
3D对象识别立体数据集此数据集由9个对象和80个测试图像组成。(Akash Kushal和Jean Ponce)
3D摄影数据集我们实验室捕获的十个多视图数据集(Yasutaka Furukawa和Jean Ponce)
3D打印RGB-D对象数据集 - 带有groundtruth CAD模型和摄像机轨迹的5个对...