语音驱动未来
2017-05-05 21:00:15 来源:麦姆斯咨询 评论:0 点击:
微访谈:Vesper首席执行官Matt Crowley
Vesper是一家从密西根大学走出来且快速成长的MEMS麦克风初创企业,总部位于美国波士顿,其愿景是为智能手机、智能扬声器、互联汽车以及所有互联设备的语音交互接口提供高可靠性的MEMS麦克风。
Yole在其近期发布的《声学MEMS和音频解决方案-2017版》报告中提到,全球MEMS麦克风市场已经达到了10亿美元规模。Vesper为MEMS麦克风市场带来了一种创新的压电MEMS技术,直接将声波的能量转换为电信号。据麦姆斯咨询此前报道,Vesper联合其合作伙伴DSP Group、Sensory,在2017 CES上首次公开展示了它们合作开发的“零功耗语音唤醒”开发平台,该平台集成了Vesper公司VM1010语音唤醒压电MEMS麦克风和DSP Group的DBMD4处理器。DBMD4是一款超低功耗、永久在线型语音和音频处理器,该处理器基于Sensory公司的Truly Handsfree™语音控制嵌入算法。
近期我们有幸采访了Vesper首席执行官Matt Crowley先生,让我们深入了解来自Vesper的最新消息。
音频价值链发展趋势
Yole Développement(以下简称YD):自我们2016年7月的访谈(参阅《MEMS麦克风新浪潮——Vesper压电MEMS麦克风》)以来,Vesper有何最新进展?
Matt Crowley(以下简称MC):自上次访谈以来,我们在多个方面获得了稳步发展。首先是良率,我们提升了工艺、改善了设计,在产品良率方面获得了大幅提高;另一个方面是性能,我们稳步地将产品SNR(信噪比)提高到了极具竞争力的水平;我们还扩展了产品规划,出样了许多不同的具有更高SNR的器件;最大的进展,应该是验证了压电MEMS器件的静态感知能力。我们在9个月内,将我们的“零功耗监听”(ZeroPower Listening™)MEMS麦克风从科学实验推向了量产。在许多情况下,匹配Vesper麦克风的电池供电设备,可以连续运行几个星期甚至几个月(在此之前往往只有几小时或几天),而无需为电池充电。
YD:如何定义一款好的麦克风产品?
MC:什么是好,这个问题人们从柏拉图时代就已经开始思考了,这是一个不能用简单的回复来回答的简单问题。我从过去3年学到的经验是,无法单独评价一款麦克风的优劣,它需要跟特定的应用相联系。有些方面很明显,永远都是优势,例如可靠性、防颗粒物性能以及防潮性能等,但是,它们只在某些应用中会比其它因素更重要。一些麦克风需要高度抗射频(RF)噪音性能,而其它麦克风并不需要。一些系统能从80dB的SNR产品获益,而其它系统根本用不到60dB以上的性能。很明显的是,市场正在快速扩张进入新的应用,一款好的智能手机麦克风并不一定需要是一款好的物联网麦克风。
YD:相比电容MEMS麦克风,压电MEMS麦克风的典型功耗如何?
MC:在正常运行模式下,电容MEMS麦克风的功耗相近或可能略优于压电MEMS麦克风。不过,压电MEMS麦克风可以在声音唤醒(wake on sound, WOS)模式下工作,而电容式MEMS麦克风无法实现这一功能。目前,我们的压电MEMS麦克风在WOS模式下的功耗大约为8uA,我们预计能够降低到1uA以下。因此,我们将Vesper能够运行WOS模式的麦克风称之为“零功耗监听”器件。
YD:你们如何评测你们的麦克风性能?会采用哪些测试方法?
MC:Vesper拥有很好的测试实验室,我们在开发新的测试设备方面投入很多。因为压电MEMS麦克风具有很低的本底噪声,因此需要极低的噪音测试方案。我们会测量所有通用的电学和声学参数,例如灵敏度、噪音、电流、PSR以及PSRR等。此外,我们还测试可靠性,包括许多仅有Vesper才能通过的测试,如油性蒸汽暴露测试和粉尘暴露测试等。对于工程开发,我们还进行100%声学MEMS探针测试,这也是Vesper独有的。最后,我们还开发了一款高通量表征系统,能够测试已封装麦克风所有的声学和电学性质。
Vesper开发了一套一次能够测试数千颗MEMS麦克风的自动设备。每颗麦克风都会在气密隔音腔中单独测试,确保了每颗MEMS麦克风的性能。
YD:关于灵敏度和SNR,您能详细介绍一下吗?
MC:MEMS麦克风的灵敏度一般主要由MEMS芯片决定。MEMS麦克风的本底噪音由MEMS芯片、ASIC或封装的背腔声阻限制。对于电容MEMS麦克风,MEMS自身的挤压膜阻尼决定了麦克风的本底噪声。而对于压电MEMS麦克风,本底噪声大多受封装影响。另一个因素是噪声的积分范围。通常是从20Hz到20kHz的加权,这是人类听觉的理论极限。但是,这或许不是适合所有系统的品质因数,因为有些系统并不需要所有的这些数据。例如,传统窄带移动电话使用300Hz 到 3.4kHz的范围,宽带手机则使用50Hz到7kHz的音频范围,而语音交互设备则采用最高8kHz的数据,这意味着更小的积分范围往往更合适。
YD:你们计划何时推出一款SNR超过70dB的麦克风?
MC:我们已经开发出了69dB的原型产品,因此我们有能力开发出更高SNR的产品。我们目前首要专注于推出完整的零功耗监听MEMS麦克风产品线,然后我们将推出更高SNR的产品。我们目前已有一些唾手可得的MEMS和ASIC设计,将会在2018年实现量产,还有一些MEMS工艺改善将在未来持续的提高产品的灵敏度。
YD:你们的首款产品在芯片尺寸方面,紧随目前的产业标准,你们在缩小麦克风尺寸方面有何规划?
MC:目前,在芯片尺寸方面,我们将紧跟产业趋势。这也能帮助我们的封装合作伙伴,更好地为其客户提供定制化服务。
YD:在手持设备中(智能手机、个人语音助手、智能手表、HMD),我们看到越来越多的麦克风应用,你们似乎优先考虑的便是消费类业务领域,为什么会有此选择?平均售价更高的利基市场或许也是一条发展之路?
MC:我们2017年的市场目标,是为低功耗永久在线监听语音阵列提供最好的MEMS麦克风。这将覆盖许多相关产品,主要在智能家居和听觉可穿戴细分市场。这些是我们独特的技术所能发挥价值的高增长细分市场,是Vesper切入的良机。智能手机市场到目前来看还是规模最大的市场,但是由于种种原因,并不一定是新技术的最佳切入点。
YD:利用你们的麦克风,可以选择所需要监听的方向,您能介绍一下这项技术或将开辟哪类应用呢?
MC:这些定向阵列非常适用于音频事件探测,例如安防摄像头或语音交互阵列等。当前,有许多系统采用按键来开启或激活语音交互,因此,系统开发商非常希望能打造一款能够实现低功耗永久在线监听的产品。
YD:在MEMS领域开创这样的业务需要投入多少资金?Vesper的诞生走过了哪些重要步骤?
MC:Vesper至今融资了1700万美元,对于一家典型MEMS厂商来说很少。我们之所以能够成功,是因为我们的创始人募集了很多资助,并且我们的专业团队的资本效率非常高。而一家典型的MEMS厂商一般需要5000万到1亿美元。
YD:不知不觉我们已经走到了2017年第二季度,你们的目标达成情况如何?目前有哪些重要的里程碑事件?
MC:是的,2017年到现在,我们进展很不错!我们创造了第一个“100万颗MEMS芯片”里程碑,并获得了大量有价值的数据和元件,来引导我们下一步的工程开发和制造目标。对于2017年,我们的目标是“零功耗监听”MEMS麦克风在一些知名品牌的平台,获得更多的订单和出货量。
YD:今年及未来5年,在出货量方面你们的目标是?
MC:具体的数量目标我现在不方便给出,但是对于2017年,我们要开始朝智能手机的规模扩展我们的供应链。客户的要求越来越高,市场也在不断增长,因此还有大量工作需要有条不紊地进行,以扩展我们的供应链和客户支持网络。
YD:到目前为止,Vesper一直专注于硬件端,随着智能麦克风成为新的趋势,你们在软件方面如何规划?你们有和DSP(数字信号处理器)厂商建立合作,应用降噪、风噪处理等技术吗?
MC:我们已经和Sensory、Amazon以及DSP集团等软件公司建立了合作关系。我认为智能麦克风在未来会越来越普遍,尤其是在物联网市场。智能麦克风在智能手机市场并没有多少市场,是因为大多数智能手机已经拥有了一颗传感器数据处理器,这使得MEMS麦克风的数字信号处理器有些多余了。而且,大型OEM和SOC厂商也想通过开发自己的软件来占领智能手机市场。随着我们的竞争对手开始涉足DSP和算法,这为市场打开了一块空间。目前的DSP和算法供应商倾向于和纯MEMS厂商合作,在毫无知识产权泄露的风险下开发最佳的解决方案。到目前为止,Vesper的核心竞争力还在于压电MEMS技术,而非软件。
YD:您多次提到你们的技术有潜力设计压力、超声波或化学传感器,在这些领域的计划如何?
MC:压电MEMS有许多应用。这些都是我们在积极探索的领域,并申请了很多专利,但是,我们目前还没有实际的开发计划。作为一家初创公司,我们需要更加专注,随着我们的成长会有很多的机遇来扩展我们的业务领域。进入压电MEMS技术领域的厂商越多,对于Vesper来说是好事,因为这将促进整个压电技术生态系统的发展。
延伸阅读:
《Vesper联合DSP Group在2017 CES展示零功耗语音唤醒》
上一篇:音频领域已经为迎接MEMS微型扬声器做好准备
下一篇:智能精准给药改善肿瘤治疗