智能音箱的科技原理是什么?与常规音响有何不同之处?

 
点击 54回复 0 原帖 2022-01-18 15:32

首先,音箱作为前端在目前的意义远大于作为前端+后端的融合,而目前远场识别本就也是个还没完全解决的问题。



所以作者你用NLP作为论据来说音箱的发展限制我认为不是非常符合,与其相比更加单纯的语义理解或交互对话的应用和场景(比如输入输出都是文字)更加适合你文中的分析。当然NLP的发展的确是限制了智能音箱的性能,只是除此之外音箱还有更多的问题要解决。



而Nlp算是强人工智能问题,短期内不好解决。语义解析的问题在于,不仅仅要使用文本字符本身的统计信息,还是使用语言学,背景知识和常识。中文的处理就更难了,光第一步切词就带来好多错误。其实国内现在很多公司已经不单纯的用rule了,通过意图+填槽式的任务型多轮对话框架,在某些封闭的domain已经能够实现比较好的效果,只不过数据和模型基本不可复用到其他领域。



不过从某种意义上来看,这种任务型的框架式的语义表示也并不是真的对语言的理解,还是丢失掉了不少信息的。我感觉解决这个问题,得起码得机器人像人一样理解和推理才行,不能靠堆规则。如果还能具有自动搜索资源,自动理解和自动构建知识库的能力才是真正完善的智能机器人。



最后,音响核心是声音,声音无非就是说话或者放歌。智能音响与常规音响不同之处在于智能。



但是依然文本分析和语义解释,根本就不是智能,不过是比较精巧的复制粘贴。因为没有智能,在用户使用的初期有新鲜感,一段时间后就不喜欢了。所以这种产品应该锁定用户为儿童学生和喜欢科技尝鲜的人,市场不大。


举报收藏 0打赏 0