知道语音助手背后的公司如何处理你的语音数据吗?

熟悉Alexa、Cortana、Google Assistant、Bixby或Siri吗?每天都有数亿人使用由亚马逊、微软、谷歌、三星或苹果开发的语音助手,而且使用人数还在不断增长。

据外媒报道,科技出版物Voicebot最近进行的一项调查显示,每月有9010万美国成年人在智能手机上使用语音助手,7700万人在汽车上使用,4570万人在智能扬声器上使用。

然而许多用户可能没有意识到他们的语音记录不会被立即删除。相反,它们可能会被存储多年,某些记录甚至会由审阅人员进行人工分析。媒体询问了这些公司如何处理数据收集和审查,并分析了他们的隐私政策。


亚马逊


亚马逊表示,为了改善客户体验,只对非常小的语音记录样本进行分析。例如会训练语音识别和自然语言理解系统,以便Alexa能更好地理解用户请求。亚马逊雇佣了第三方承包商来审查这些录音,但亚马逊表示,公司有严格的技术和操作保障措施以防止记录被滥用,而且这些员工无法直接获得识别信息(只有账号、名字和设备序列号)。

亚马逊发言人在一份声明中表示:“所有信息都被高度保密,我们使用多因素认证来限制访问、加密服务和审计控制环境。”

在web和app设置页面中,亚马逊为用户提供了禁用语音录制功能的选项。不过,该公司表示,在定期审查的过程中,选择禁用的用户的录音可能还是会被人工分析。


苹果 


苹果在其隐私页面讨论了Siri录制音频的审核过程。它解释说,出于更好地开发和保证质量,只对Siri数据的一小部分进行了“评分”,并对其进行了标注,每个评分者都会根据音频质量进行分类,并指出正确的操作。这些标签有助于持续提高Siri识别系统的质量。

苹果补充说,供审查的录音都是加密和匿名的,与用户的姓名或身份无关。此外,审阅人员不会收到用户设备的标识符。这些语音记录会被保存6个月,在此期间,Siri的识别系统会对这些录音进行分析,以“更好地理解”用户的声音。六个月后,这些没有标识符的录音也继续将被保存下来,用于改进和开发Siri,最长可保存两年。

苹果允许用户选择完全退出Siri,或者使用“Type to Siri”工具手动输入命令。但该公司表示,“一小部分”数据可能会在两年后继续用于Siri的持续改进和质量保证。


谷歌


谷歌的一位发言人称,谷歌只进行非常有限的音频转录,以改进语音识别系统,并且应用了广泛的技术来保护用户的隐私。

谷歌审核的音频片段与任何可识别的个人信息都没有关联,而且转录基本上是自动的,不由谷歌员工处理。此外,在使用第三方服务来审查数据的情况下,谷歌通常提供文本,不提供音频。

谷歌还表示,它正在开发不需要人类标记的技术,并为此发表了研究成果。例如,在从文本到语音(TTS)领域,Tacotron 2系统可以基于谱图构建语音合成模型,WaveNet系统则可以根据波形生成模型。 

谷歌会无限期地存储Google Assistant录制的音频片段。但是,谷歌与亚马逊和苹果一样,允许用户永久删除这些录音,并选择不参与未来的数据收集。

尽管如此,谷歌在其隐私政策中表示,可能保留与服务相关的信息,以防止垃圾邮件和滥用,并改善服务。


微软


微软的一位代表表示,微软的支持页面中概述了微软在Cortana方面的隐私做法。微软收集语音数据是为了加强Cortana对个人用户语音模式的理解,不断改进Cortana的识别和响应,以及改进其他使用语音识别和理解的产品和服务。

但是还不清楚是由微软员工还是第三方承包商进行人工审查,以及数据是如何匿名的。但该公司表示,只有启用了“Hey Cortana”功能的电脑,Cortana才会收集语音。

微软允许用户通过访问Windows 10中的控制面板或搜索页面来选择退出语音识别。


三星


三星没有立即回复媒体的采访请求,但其Bixby支持网站上的常见问题页面概述了Bixby收集和使用语音数据的方式。三星表示,会利用语音命令和对话来改善产品体验,并利用过去的对话记录帮助Bixby更好地理解不同的发音和语音模式。


根据三星的隐私政策,一个未公开的第三方提供了语音到文本的转换服务。虽然三星没有明确说明这些命令的存储时间,但它表示,其用户保留政策考虑了法定时效和个人使用Bixby的时间。用户也可通过三星Galaxy设备上的BixbyHome应用程序删除Bixby对话和录音。


发表评论 取消回复

电子邮件地址不会被公开。 必填项已用*标注