人工智能时代:未来已来 第五章 人工智能时代的商业未来 (第1/5页)
杨爱喜提示您:看后求收藏(愛看小說網2kantxt.com),接着再看更方便。
语音识别带来的行业变革
随着人工智能技术的发展,人工智能技术的商业化成为了市场关注的一个的焦点。一项技术能否继续发展,商业化是一个关键。在前面的章节之中,我们曾谈到人工智能发展过程中经历过几个低谷。而在人工智能发展过程中的第一个低谷就是因为人工智能的研究无法创造出市场价值,所以才导致人工智能的发展停滞不前。
在现阶段,随着社会经济的发展,人工智能技术的应用也获得了良好的环境。越来越多的人工智能产品不断涌现出来,在为我们的生活创造便利的同时,也创造出了巨大的市场价值。在这一章之中,我们将介绍一些现阶段人工智能技术的商业化应用,通过这些技术应用,我们将能够看到一个日臻完善的人工智能时代的全貌。
在众多的人工智能技术之中,语音识别技术可以说是人工智能领域的一项重要成就。不仅在人工智能领域,在信息技术领域之中,语音识别也是一项重要的科学技术。作为一门交叉学科,语音识别已经开始成为信息技术之中人机接口的关键技术,同时语音技术的应用也已经逐渐发展成为了一个新型的高新技术产业。
在人类的历史长河之中,人类渴望与世间万物进行交流,并创造出了无数的神话传说来描写这种想象。随着人类历史进入机械化时代,人类又希望自己创造的机器能够听懂自己的话,从而能够更好的为自己工作。但由于时代和技术的局限,人类的这一想象始终没有机会实现。
现在随着人工智能技术的发展,语音识别将让人类多年的想象成为现实。作为一种让机器通过识别和理解过程把语音信号转变为相应的文本或命令的技术,语音识别将会在机器和人类之间架起一座桥梁,让人类能够更加自如的操控机器。正如电影《钢铁侠》之中,Tony与“贾维斯”之间一样,正是依靠语音识别技术,才能让他们之间能够更好的展开交流。
对于大多数人来说,提到语音识别可能更多会想到自己智能手机中的语音助手,苹果公司的Siri、谷歌公司的Google Now、微软公司的Cortana等。现在我们所使用的大多数智能手机都具备一定程度的智能语音功能,我们在前面也详细介绍过这些智能语音助手。而实际上,这只是语音识别技术应用的一个方面,在许多其他领域之中,语音识别技术也已经得到了广泛的应用。在了解这些之前,我们首先了解一下与语音识别技术相关的一些重要内容。
就语音识别技术而言,最早的声码器可以被看做是语音识别技术的雏形。早在1920年,一种叫做“Radio Rex”的玩具狗被认为是最早的语音识别器,但它听到别人在叫它的名字时,它就会从底座上面弹出来。虽然相对来说比较简单,但可以说这是已知人类最早制造的一种语音识别产品。
对于语音识别技术来说,最为主要的就是数据统计模型和算法,这也被认为是语音识别技术的重要组成部分。简单来说,数据统计模型就像是一个巨大的存储中心,在这里有着许许多多不同的数据,而算法则是这个存储中心中的工作人员,当收到外面的指示时,工作人员会在存储中心中找到相应的物件。
在这里面其实存在这一个显见的问题,也就是语音识别的准确率问题。从上面的介绍中,我们可以知道,当算法保持不变时,数据统计模型之中的数据量越多,那么整个语音识别系统的识别能力也就越强,那么是不是说我们只要不断的增加数据库之中的数据量,就能够进一步增加语音识别的准确率了呢?
关于这个问题,原则上应该是这样的,但实际操作上,这种方法却很难行得通。就像是没有一个仓库能够存储世界上的所有货物一样,我们也没有办法搭建一个数据统计模型来将所有的数据囊括其中。更何况人类在交流过程中,所涉及到的数据量是非常大的,所以单纯的通过这种方法提升语音识别的准确率是比较困难的。
所以如果采用上面的组合构建语音识别系统,人类必须按照特定的语言和设备进行交流,这样设备才能够听得懂。但随着语音识别技术的发展,现在的一些语音识别系统可以通过一定的规则和算法,把那些并不存在于数据统计模型之中的数据也计算出来,这样便不需要将所有的数据都增添到数据统计模型之中。
当然这一类型的语音识别系统的仍然需要一个数据库,作为语音识别的数据基础,从而保障语音识别的正确性。在数据库的基础之上,当一段语音被输入之后,模型便会依照自己的算法,来从数据库之中寻找最为合适的一句。
在这里,深度神经网络的应用促进了语音识别技术的发展。深度神经网络能够采用高位特征训练来进行模拟,从而最终形成一个较为理想的适合模式分类的特征。而深度神经网络的建模技术能够和传统的语音识别技术进行无缝对接,这样便能够大大的提高语音识别系统的识别率。
语音识别技术的主要功能,具体表现在4个方面。首先是声纹识别,这是根据语音波形中反映说话人生理和行为特征的语音参数,来自动识别说话人身份的一种技术。一方面,这种技术可以用于说话人的辨认,就是从众多的发音者之中选出某一语音是哪一个人说的。而另一方面则可以用于说话人的确认,就是确认某一语音材料是由指定的某个人说的。声纹与指纹一样,都是每一个人的独有的生物特性。
其次是内容辨识,有别于声纹识别,这是对语音材料所承载的实际意义的识别。但相对来说,想要识别话语的内容,要比识别声纹要困难的多。因为不同的人可能在发音方法、发音器官和发音状态上都会有所不同。这便要求内容辨识要通过结构分析和语境理解等程序,来保证对话语内容的正确识别。
第三是语种识别,可以说这是话语内容识别的一个重要基础,计算机只有首先识别出话语的语种,才能将整段话语分类到相应的识别器之中进行话语识别。
最后则是语音标准识别,这一功能主要应用于语言教学的规范和语音标准的测试方面,主要是对于跟人语音标准状况的一个判断,并指出其中的不足之处。
在具体的行业应用方面,语音识别技术已经深入到了众多垂直行业领域之中。在医疗领域,除了在一些可供穿戴的设备之中搭载语音识别系统之外,语音识别技术还在其他方面具有重要的作用。通过在医院内建立完整的数据库,可以将许多疾病、药品名称进行精确的识别,同时还可以将医院的病历资料存储在安全的云空间之中,而利用语音识别技术便可以轻松的搜索出想要寻找的资料,大大节省了寻找资料的时间与存储资料的空间。
还有在智能车载和智能穿戴方面,语音识别技术可以解放人们的双手,同时也增加驾驶之中的安全性。通过简单的语音控制就可以实现一系列复杂操作,让我们的生活变得更加便利和快捷。智能家居也是语音识别技术的一个重要应用场景,当所有的家居设备都通过物联网连接在一起时,我们只需要简单的说几句话,就能够将家中的智能设备调整到自己想要的状态。
在商业应用上,语音识别技术的商业化正在逐渐发展之中。在不久的将来,如果你看到一个人在街道上与一辆汽车进行对话,那么不要惊讶,可能你很快也会这样去做。
AR技术:身临其境的增强现实
在我们的生活中,什么是虚拟的,什么是现实的,它们之间的界限在哪里?在现在这个阶段,我们可能并不需要考虑这个哲学性的问题。但不久之后,我们可能必须要首先弄清楚这个问题,才能够更好的享受生活。因为在未来,我们眼前的现实可能都将会变成虚拟的。
上面所说的并不是科幻电影之中对于未来的描述,而是在我们的现实生活之中,很可能会发生的事实。虽然我们不确定这一时刻什么时候回到来,但随着人工智能技术的发展,我们是很有可能会迎来这一时刻的。
而对于这一时刻的到来,起到关键作用的就是人工智能技术之中的AR技术。AR技术又被称为增强现实技术,这是一种实时地计算摄影机影像的位置以及角度并且加上相应图像的技术,其目标是在屏幕上把虚拟世界套在现实世界并且进行互动。从这里可以看出,AR技术就是一种将虚拟世界与现实世界叠加互动的技术,所以说当AR技术的应用普及之后,虽然我们的现实不会变成虚拟的,但是对于我们来说虚拟和现实之间的界线将会变得模糊。
增强现实技术是一种将真实世界信息与虚拟世界信息集成在一起的新技术,就是把在现实世界中一定时间和空间范围内很难体验到的实体信息,通过计算机技术进行模拟仿真,然后在将虚拟的信息叠加应用到真实世界之中,从而被人类的感官所感知到,最终让人达到一种超越现实的感官体验。