
Google推出Android语音转字幕应用程序Live Transcribe,以帮助听障人士与外界沟通,并进一步公开其设计细节。这个应用程序使用了当前Google云端自动语音辨识(Automatic Speech Recognition ,ASR)技术,以及设备上机器学习,并且与专为聋人和弱听人士而设的高立德大学合作,进行使用者体验研究。
通过自动语音辨识技术,耳聋和听力障碍人士可以更方便的接受外界的语音信息,Google在YouTube中应用自动语音辨识提供字幕,也用于简报展示以及电话拨打中。虽然这项技术在这几年已经有长足的进步,但是听障人士仍主要依赖人工手动转录服务,而这些服务价格昂贵,还需要事先安排,间接影响听障人士参与社交的机会。
Google解释过去之所以自动转录服务还无法普及的原因,除了因为应用自动语音辨识进行转录,需要计算密集的模型之外,还需要进行详尽的使用者研究以及付出高昂的访问成本,Google结合广泛的用户体体验,以及无缝且可持续连接提供服务的服务器,打造出Live Transcribe服务。
Google设计Live Transcribe其中一个重要的考量,是避免使用者消耗过多移动流量。为此,Google在移动设备上实作了类神经网络语音侦测器,并使用了大规模声音数据集AudioSet。Google提到,该网络是一个类似VGGish的图像模型,能够侦测语音,并且自动管理到云端自动语音辨识引擎的网络连接,在长时间使用的状况下,能最大程度减少移动用量。
本文属于原创文章,如若转载,请注明来源:Google推出低流量安卓语音转字幕应用//net.zol.com.cn/709/7091464.html