人工智能领域选题?人工智能领域
15
2024-06-10
大家好,今天给各位分享人工智能语音交互的一些知识,其中也会对人工智能语音交互引擎进行解释,文章篇幅可能偏长,如果能碰巧解决你现在面临的问题,别忘了关注本站,现在就马上开始吧!
本文目录
人工智能时代主要的人机交互方式有两个方向:语音和视觉。分别是:
1、语音:用户发出声音,机器接收转化为指令,并执行。
2、视觉:用户通过面部、肢体等面对机器摄像头,向其传达指令,机器接收后执行。
语音识别和语义理解是人工智能领域相对成熟的技术,语音交互在人工智能时代已经有了先发优势,正在被逐渐落地并且有望大规模应用。目前,语音交互已经加速在智能家居、手机、车载、智能穿戴、机器人等行业渗透和落地。
1、触摸式交互
触摸交互目前应用非常广泛,随着触摸屏手机、触摸屏电脑、触摸屏相机、触摸屏电子广告牌等等触摸屏发明创新的广泛应用与发展,触摸屏与人们的距离越来越近,真的是到了可以“触摸”的程度。而触摸屏,由于其便捷、简单、自然、节省空间、反应速度快等优点,而被人们广泛接受,成为了时下最便捷的人机交互方式来源。
2、语音识别
语音识别技术,也被称为自动语音识别AutomaticSpeechRecognition,(ASR),其目标是将人类的语音中的词汇内容转换为计算机可读的输入,例如按键、二进制编码或者字符序列。不可否认,语音识别是未来人机交互最被看好的的交互方式。尤其是针对当下的各种可穿戴式智能设备,通过对话的方式发出命令产生交互是最高效可行的。
语音交互的优势很明显,简单、直接、零学习成本。日常生活中,语言是人与人交流的最常用和直接方式。自然语言对话式的交互,即使是老人和小孩也无需学习。用户可以“无感”地唤醒设备,“无缝”地获取信息、给予指令,毫无生涩和违和感,这才是最好的智能设备交互方式。
随着当今社会科学技术的持续发展,和人们对编程技术的发展,近年来AI产业正在飞速发展,并且当今社会也有越来越多的人工智能产业实践,所以越来越多的人都开始关注人工智能方面,由此可见人工智能在当今社会中的热度,今天就来讲讲人工智能人机交互技术分类。
人工智能人机交互主要研究人和计算机之间的信息交换,主要包括人到计算机和计算机到人的两部分信息交换,是人工智能领域的重要的外围技术。
人机交互是与认知心理学、人机工程学、多媒体技术、虚拟现实技术等密切相关的综合学科。
传统的人与计算机之间的信息交换主要依靠交互设备进行,主要包括键盘、鼠标、操纵杆、数据服装、眼动跟踪器、位置跟踪器、数据手套、压力笔等输入设备,以及打印机、绘图仪、显示器、头盔式显示器、音箱等输出设备。
人机交互技术除了传统的基本交互和图形交互外,还包括语音交互、情感交互、体感交互及脑机交互等技术,以下对后四种与人工智能关联密切的典型交互手段进行介绍。
(1)人工智能人机交互技术分类——语音交互
语音交互是一种高效的交互方式,是人以自然语音或机器合成语音同计算机进行交互的综合性技术,结合了语言学、心理学、工程和计算机技术等领域的知识。
语音交互不仅要对语音识别和语音合成进行研究,还要对人在语音通道下的交互机理、行为方式等进行研究。
语音交互过程包括四部分:语音采集、语音识别、语义理解和语音合成。语音采集完成音频的录入、采样及编码;语音识别完成语音信息到机器可识别的文本信息的转化;语义理解根据语音识别转换后的文本字符或命令完成相应的操作;语音合成完成文本信息到声音信息的转换。作为人类沟通和获取信息最自然便捷的手段,语音交互比其他交互方式具备更多优势,能为人机交互带来根本性变革,是大数据和认知计算时代未来发展的制高点,具有广阔的发展前景和应用前景。
(2)人工智能人机交互技术分类——情感交互
情感是一种高层次的信息传递,而情感交互是一种交互状态,它在表达功能和信息时传递情感,勾起人们的记忆或内心的情愫。传统的人机交互无法理解和适应人的情绪或心境,缺乏情感理解和表达能力,计算机难以具有类似人一样的智能,也难以通过人机交互做到真正的和谐与自然。
情感交互就是要赋予计算机类似于人一样的观察、理解和生成各种情感的能力,最终使计算机像人一样能进行自然、亲切和生动的交互。情感交互已经成为人工智能领域中的热点方向,旨在让人机交互变得更加自然。目前,在情感交互信息的处理方式、情感描述方式、情感数据获取和处理过程、情感表达方式等方面还有诸多技术挑战。
(3)人工智能人机交互技术分类——体感交互
体感交互是个体不需要借助任何复杂的控制系统,以体感技术为基础,直接通过肢体动作与周边数字设备装置和环境进行自然的交互。依照体感方式与原理的不同,体感技术主要分为三类:惯性感测、光学感测以及光学联合感测。体感交互通常由运动追踪、手势识别、运动捕捉、面部表情识别等一系列技术支撑。
与其他交互手段相比,体感交互技术无论是硬件还是软件方面都有了较大的提升,交互设备向小型化、便携化、使用方便化等方面发展,大大降低了对用户的约束,使得交互过程更加自然。目前,体感交互在游戏娱乐、医疗辅助与康复、全自动三维建模、辅助购物、眼动仪等领域有了较为广泛的应用。
(4)人工智能人机交互技术分类——脑机交互
脑机交互又称为脑机接口,指不依赖于外围神经和肌肉等神经通道,直接实现大脑与外界信息传递的通路。脑机接口系统检测中枢神经系统活动,并将其转化为人工输出指令,能够替代、修复、增强、补充或者改善中枢神经系统的正常输出,从而改变中枢神经系统与内外环境之间的交互作用。
脑机交互通过对神经信号解码,实现脑信号到机器指令的转化,一般包括信号采集、特征提取和命令输出三个模块。从脑电信号采集的角度,一般将脑机接口分为侵入式和非侵入式两大类。
除此之外,脑机接口还有其他常见的分类方式:按照信号传输方向可以分为脑到机、机到脑和脑机双向接口;按照信号生成的类型,可分为自发式脑机接口和诱发式脑机接口;按照信号源的不同还可分为基于脑电的脑机接口、基于功能性核磁共振的脑机接口以及基于近红外光谱分析的脑机接口。
人工智能时代主要的人机交互方式为语音+视觉。
1目前常用的人机交互方式主要包括语音交互、触屏交互及视觉交互,其中智能语音人机交互是目前被大力推广的人机交互方式。
2触摸屏是目前最简单的、方便、自然的人机交互方式。
3目前多终端人机交互的方式有APP、场景开关、语音音箱、语音面板。
关于人工智能语音交互的内容到此结束,希望对大家有所帮助。