谷歌
Live Transcribe语音转文字应用 帮助听力障碍人士进行交流
近日,Google推出了一款基于Android系统的实时转录应用Live Transcribe,可以将自动字幕融入日常会话,减少现实世界中的对话障碍。
Live Transcribe是基于Google在过去几十年的自动语音识别(ASR)技术的研究基础之上,针对安卓平台的设备来开发的应用程序。支持70多种语言,覆盖全球80%以上的人口。在有网络的地方,转录延时不会超过 200 毫秒。
根据世界卫生组织统计,目前全球约有4.66亿耳聋和听力障碍患者。以往耳聋和听障人士主要依赖于人工转录服务,服务费用高昂,且通常需要提前很久预约。
Live Transcribe的产品经理Sagar Savla表示,实时语音识别的模型由三个部分组成,第一个是声音模型,主要是辨别一个单词中的不同音节;第二个是发音模型,把第一个模型辨别出来的这些音节,组成实际的单词。第三个模型是语言的模型,会根据这些单词给它增加适当的标点符号和停顿。
据了解,之所以选择在 Android 手机上开发这项无障碍服务,是因为相比电脑、平板设备、投影仪和可穿戴设备等,智能手机是相对价格成本最低廉的一种选择。
据悉,在实时这个字幕的时候是否要在旁边显示字幕转录的置信度?可能大家自然而然地就觉得,当然要去显示它的准确度是多少。但是事实上,显示这个可能就会造成一种用户体验非常不好的情况,因为都会给用户带来一种误导。
Sagar Salva还表示,Live Transcribe原本属于Google20%的创新项目,但是开始不久就立刻就意识到,这其实是一个非常切实的项目。所以最终我们其实是把它作为了一个实际的项目固定下来了,建立了相应的产品开发团队。它不光可以帮助完全听不到的聋人,对于出现听觉障碍的老年人,也非常适用。
(本文来自于财经网)