频道导航

从iOS上的麦克风输入进行语音活动检测

2020-05-18 iOS 前端之家

前端之家收集整理的这篇文章主要介绍了从iOS上的麦克风输入进行语音活动检测，前端之家小编觉得挺不错的，现在分享给大家，也给大家做个参考。

我正在开发一个基于语音的AI的iOS应用程序;即它意味着从麦克风接收语音输入,将其转换为文本,将其发送到AI代理,然后通过扬声器输出返回的文本.我已经完成了所有工作,但是使用按钮开始和停止录制语音(SpeechKit用于语音识别,API.AI用于AI,亚马逊的Polly用于输出).

我需要的是让麦克风始终打开,并在用户开始和结束谈话时自动开始和停止录制用户的声音.这个应用程序正在开发一个非正统的环境,在那里将无法访问用户的屏幕(但他们将有一个用于录制文本的高端霰弹枪麦克风).

我的研究表明,这个难题被称为“语音活动检测”,似乎是整个基于语音的AI系统中最困难的步骤之一.

我希望有人可以提供一些简单的(Swift)代码来自己实现,或者指向我可以在这个项目中实现的一些像样的库/ SDK的方向.

解决方法

为了获得良好的VAD算法,您可以使用 py-webrtcvad.

它是C代码的Python接口,您只需从项目中导入C文件并从swift中使用它们即可.

上一篇：ios – SpriteKit在转换到新场景时下一篇：无法从iOS 7中的App Store Receipt

猜你在找的iOS相关文章

去除友盟等第三方SDK失败的解决办法(clang: error: no such file or directory:xx)

背景前端时间产品经理决定使用百度统计，使得工程B 中原统计sdk-友盟统计，需要被去除。...

作者：前端之家时间：2020-11-26

alloc 和 init都做了什么验证。

结论： alloc负责分配内存和创建对象对应的isa指针； init只是返回alloc生成的对象。所以...

作者：前端之家时间：2020-11-26

用launchscreen.storyboard适配启动图方法

更新如果UI愿意把启动图切割成n份，按一定约束在launchscreen.storyboard中进行排版，启动...

作者：前端之家时间：2020-11-26

OC循环方法推荐-块循环遍历（比for循环好用）

最近在看一本书《Effective OC 2.0》,今天看到有个tip是OC适中循环各自优劣性，作者最终推...

作者：前端之家时间：2020-11-26

使用PaintCode便捷地实现动画效果

// // ViewController.m // paintCodeTestOC //gif // Created by LongMa on 2019/7/25. /...

作者：前端之家时间：2020-11-26

关于数组内元素是否会被改变的思考

起因项目中双层for循环时，想当然的认为内部局部指针变量的变化会影响外面数组中模型的地...

作者：前端之家时间：2020-11-26

定位权限请求时易犯的错误小结

起因用户群反馈app可能请求了不合适的定位权限：始终定位。看到这个截图，根据经验判断可...

作者：前端之家时间：2020-11-26

用launchscreen.storyboard适配启动图方法(二)

背景之前有写一篇实现方式比较简单的随笔用launchscreen.storyboard适配启动图方法，顺便...

作者：前端之家时间：2020-11-26

oc工程中oc、swift混编代码打包成静态framework踩坑笔记

参考资料： https://www.jianshu.com/p/734341f7c242 https://www.jianshu.com/p/55038871...

作者：前端之家时间：2020-11-26

用墨卡托和GPS坐标计算距离时误差测试

iOS墨卡托和GPS坐标计算距离时误差测试，测试结果：墨卡托和gps坐标来回转换没有误差。墨...

作者：前端之家时间：2020-11-26

编程分类

iOS Android Swift Hybrid Cocos2d-x Flutter Xcode Silverlight cocoa Cordova

最新文章