作者
Chris Welsh
Chris作为Retune DSP公司的合伙人,于2021公司并购时加入恩智浦。Chris专注于通过差异化的语音软件技术和服务为客户创造价值。Chris为恩智浦带来了超过25年的嵌入式语音和音频业务经验,他曾经在AT&T、朗讯科技、MWM声学、哈曼国际和Retune DSP等公司担任工程师、商务拓展、创始人、总经理和高管等职务。Chris拥有普渡大学机械工程学学士学位和宾夕法尼亚州立大学声学硕士学位。
从智能家居到汽车信息娱乐系统再到智能工厂,语音控制的创新用例正在迅速涌现。然而,对开发人员来说,实现可靠的设备端语音控制颇具挑战。恩智浦推出了免版税的智能语音技术软件和在线培训工具,可降低向边缘设备添加语音的成本和复杂性。
带触摸功能的人机界面(HMI)正朝着更简单、更直观的方式发展,可控制我们生活中五花八门的设备。语音,即人们讲话的声音,是最自然、最直观的人机界面,也是下一代智能边缘设备广受欢迎的非接触式界面。
人人都想要语音控制,更广泛的语音控制。随着智能音箱及Alexa、Siri、Google Assistant等基于人工智能的语音助手的爆炸式增长,我们已经习惯了语音控制的便利性。我们的家庭、工作场所和汽车也随之产生了对语音设备的强劲需求。
除了智能音箱和遥控器之外,我们看到了越来越多的语音支持用例。开发人员利用机器学习(ML)和语音建模的强大功能,使用定制命令和多个唤醒词将本地语音控制功能添加到无数智能家居、楼宇自动化、可穿戴设备、工业和汽车信息娱乐系统应用中。这一功能无需最终产品联网即可实现。本地语音控制在设备独立上运行,可最大限度地减少与云端语音助手相关的隐私、安全和延迟问题。
最新动态:智能语音技术为客户提供免费的综合语音控制软件包,可作为现成软件库提供。
从物联网开发者到系统集成商,每个人都想为智能边缘设备添加语音功能。但并没有万能的语音解决方案。正如恩智浦的边缘处理产品组合有不同的价位、功能集和性能水平一样,我们也提供不同级别的语音技术,从低成本、易于部署的本地语音控制到高精度、高性能的语音解决方案。我们全面的芯片、软件语音解决方案产品组合可扩展到恩智浦 EdgeVerse™ 处理产品组合。
恩智浦致力于简化语音控制部署,降低系统成本和复杂性,让开发人员更轻松地将设备上语音控制创新功能推向市场。我们的目标是帮助世界各地的开发人员为几乎所有事物添加语音接口,包括消费电子、智能家居控制、工业及汽车应用。想象一下,仅用简单的语音命令,就可以控制洗衣机、预热烤箱、打开汽车后备箱、选择电梯楼层,这就是解放双手的便捷性。语音用例数之不尽。
我们语音支持产品组合的最新成员是智能语音技术(VIT),这是一种全面的先进语音控制软件解决方案,可作为MCUXpresso软件开发套件(SDK)中的现成软件库。我们推出VIT解决方案,有助于激发开发人员发明新的创新应用,实现本地语音控制,并自由轻松地训练自己的命令,不似其他解决方案仍需专用工具或录音。因为VIT软件不需版税,它适用于边缘设备应用的大规模生产,开发人员无需承担任何费用。
VIT软件基于先进的深度学习和语音识别技术,提供了完整的远场音频前端(AFE),支持多达三个麦克风、一个始终开启的唤醒词引擎和一个语音命令引擎,以及生成客户定义的唤醒词和语音命令模型的在线工具。
实现可靠的设备端语音控制并不容易,开发人员需要选择高性能信号处理硬件平台以及语音处理软件,包括AFE波束形成器、单独的唤醒词引擎和语音命令引擎。
VIT提供全面、灵活的软件解决方案以简化开发人员的工作并精简开发流程,该解决方案整合了创建设备端语音控制应用所需的一切,而不需要复杂的云连接。
VIT主要特性:
VIT使用最先进的深度学习技术帮助开发人员创建和编程语音命令词汇表。VIT工具将用户输入的文本命令映射到音素序列,并为目标设备软件生成可下载的模型文件。语音命令使用机器学习和深度学习技术进行处理,创建神经网络模型。
VIT远场AFE支持无需调谐的不同麦克风拓扑,以及具有设备端处理功能的本地语音命令识别。有了VIT的文本到模型的方法,可以轻松制作唤醒词和命令的定制版本。
VIT软件可在基于Arm®Cortex®-M7和M33、Cadence®Xtensa®HiFi 4和Fusion F1内核的几种广受欢迎的恩智浦i.MX边缘处理平台上使用。目前以下i.MX crossover MCU平台支持VIT,将来还有其他产品支持此技术。
VIT软件易于使用,消除了在边缘设备上开发设备端语音应用的准入障碍。为了加快上市,我们提供全面的开发环境,包括我们广受欢迎的MCUXpresso SDK和功能齐全的示例应用,可以快速评估目标MCU平台上的语音控制。
不限量产数量,客户均可免费获取配套的在线训练工具通过恩智浦的免费在线工具,无需录音,客户可使用简单的文本输入自行定义唤醒词和语音命令。
为您的下一个边缘应用添加经济实惠、易于使用的本地语音控制。VIT现在可作为MCUXpresso SDK中随时可用的完整数据库,免费提供给恩智浦客户。了解更多信息并获取VIT建模工具,请访问www.nxp.com/vit。
恩智浦提供一系列语音控制和通信软件和系统解决方案,为人对人和人对机器的语音应用提供高质量、可靠的嵌入式语音处理。
边缘处理业务部物联网语音和音频业务发展总监
Chris作为Retune DSP公司的合伙人,于2021公司并购时加入恩智浦。Chris专注于通过差异化的语音软件技术和服务为客户创造价值。Chris为恩智浦带来了超过25年的嵌入式语音和音频业务经验,他曾经在AT&T、朗讯科技、MWM声学、哈曼国际和Retune DSP等公司担任工程师、商务拓展、创始人、总经理和高管等职务。Chris拥有普渡大学机械工程学学士学位和宾夕法尼亚州立大学声学硕士学位。
2022年1月25日
2022年2月28日
by Liviu Ene
2022年1月24日
by Andy Lin