+

CN112256234B - 一种控制音量的方法、装置及计算机可读介质 - Google Patents

一种控制音量的方法、装置及计算机可读介质 Download PDF

Info

Publication number
CN112256234B
CN112256234B CN202011228455.0A CN202011228455A CN112256234B CN 112256234 B CN112256234 B CN 112256234B CN 202011228455 A CN202011228455 A CN 202011228455A CN 112256234 B CN112256234 B CN 112256234B
Authority
CN
China
Prior art keywords
sound
volume
ambient
frequency
robot
Prior art date
Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
Active
Application number
CN202011228455.0A
Other languages
English (en)
Other versions
CN112256234A (zh
Inventor
李小军
严裕杰
Current Assignee (The listed assignees may be inaccurate. Google has not performed a legal analysis and makes no representation or warranty as to the accuracy of the list.)
Yipusen Health Technology Shenzhen Co ltd
Original Assignee
Yipusen Health Technology Shenzhen Co ltd
Priority date (The priority date is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the date listed.)
Filing date
Publication date
Application filed by Yipusen Health Technology Shenzhen Co ltd filed Critical Yipusen Health Technology Shenzhen Co ltd
Priority to CN202011228455.0A priority Critical patent/CN112256234B/zh
Publication of CN112256234A publication Critical patent/CN112256234A/zh
Application granted granted Critical
Publication of CN112256234B publication Critical patent/CN112256234B/zh
Active legal-status Critical Current
Anticipated expiration legal-status Critical

Links

Images

Classifications

    • GPHYSICS
    • G06COMPUTING OR CALCULATING; COUNTING
    • G06FELECTRIC DIGITAL DATA PROCESSING
    • G06F3/00Input arrangements for transferring data to be processed into a form capable of being handled by the computer; Output arrangements for transferring data from processing unit to output unit, e.g. interface arrangements
    • G06F3/16Sound input; Sound output
    • G06F3/165Management of the audio stream, e.g. setting of volume, audio stream path

Landscapes

  • Engineering & Computer Science (AREA)
  • Theoretical Computer Science (AREA)
  • Multimedia (AREA)
  • Health & Medical Sciences (AREA)
  • Audiology, Speech & Language Pathology (AREA)
  • General Health & Medical Sciences (AREA)
  • Human Computer Interaction (AREA)
  • Physics & Mathematics (AREA)
  • General Engineering & Computer Science (AREA)
  • General Physics & Mathematics (AREA)
  • Manipulator (AREA)

Abstract

本申请的实施例提供了一种控制音量的方法及装置。该控制音量的方法包括:在机器人行进过程中,通过设于所述机器人自身的声音采集装置获取第一环境声音,并获取布设于行进场景中的声音采集装置采集到的第二环境声音;基于所述第一环境声音和所述第二环境声音,确定当前位置处对应的平均环境音量;基于所述平均环境音量,确定目标语音播放模式;将当前语音播放模式调整为所述目标语音播放模式,并基于所述目标语音播放模式中的音量播报语音。本申请实施例的技术方案既可以适当的提醒行人,又不会引起过大的噪声干扰外界环境,提高了机器人播放语音的舒适性,以及机器人音量控制的自适应性和精确性。

Description

一种控制音量的方法、装置及计算机可读介质
技术领域
本申请涉及计算机及通信技术领域,具体而言,涉及一种控制音量的方法及装置。
背景技术
在目前很多智能机器人,跟人交互是通过语音来实现的,但是机器人的语音很难控制,容易出现声音较大或者声音较小的问题。相关技术中一般通过人为控制机器人,比如通过终端、遥控器之类的设备来控制机器人,但是这种方式需要人为看护,噪声成本较高的问题。因此导致机器人音量控制不稳定、与人之间的交互困难且舒适度较低的问题。
发明内容
本申请的实施例提供了一种控制音量的方法及装置,进而至少在一定程度上可以提高机器人播放语音的舒适性,以及机器音量控制的自适应性和精确性。
本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
根据本申请实施例的一个方面,提供了一种控制音量的方法,包括:在机器人行进过程中,通过设于所述机器人自身的声音采集装置获取第一环境声音,并获取布设于行进场景中的声音采集装置采集到的第二环境声音;基于所述第一环境声音和所述第二环境声音,确定当前位置处对应的平均环境音量;基于所述平均环境音量,确定目标语音播放模式;将当前语音播放模式调整为所述目标语音播放模式,并基于所述目标语音播放模式中的音量播报语音。
在本申请的一些实施例中,基于前述方案,所述基于所述第一环境声音和所述第二环境声音,确定当前位置处对应的平均环境音量,包括:识别所述第一环境声音和第二环境声音中的干扰声音频率;滤除所述第一环境声音和所述第二环境声音中所述干扰声音频率对应的声音,分别得到第一过滤声音和第二过滤声音;基于所述第一过滤声音和所述第二过滤声音,确定当前位置处对应的平均环境音量。
在本申请的一些实施例中,基于前述方案,所述干扰声音频率包括频率大于第一设定频率的超高音量频率、频率小于第二设定频率的超低音量频率;所述识别所述第一环境声音和第二环境声音中的干扰声音频率,包括:从所述第一环境声音和第二环境声音中提取环境音量特征;基于所述环境音量特征和设定的音频分类模型,识别所述第一环境声音中包含的超高音量频率和超低音量频率、以及所述第二环境声音中包含的超高音量频率和超低音量频率。
在本申请的一些实施例中,基于前述方案,所述基于所述第一过滤声音和所述第二过滤声音,确定当前位置处对应的平均环境音量,包括:检测所述第一过滤声音对应的第一音量、以及第二过滤声音对应的第二音量;基于针对机器人自身设定的第一加权系数对所述第一音量进行加权处理,得到第一音量分量;基于针对所述声音采集装置设定的第二加权系数对所述第二音量进行加权处理,得到第二音量分量;基于所述第一音量分量和所述第二音量分量,计算当前位置处对应的平均环境音量。
在本申请的一些实施例中,基于前述方案,所述获取布设于行进场景中的声音采集装置采集到的第二环境声音,包括:基于当前行进位置,确定设定区域范围内的目标声音采集装置;获取所述目标声音采集装置采集到的具有设定时长的第二环境声音。
在本申请的一些实施例中,基于前述方案,所述基于所述平均环境音量,确定目标语音播放模式,包括:获取当前行进位置处对应的道路标识,并获取所述道路标识对应的设定语音模式;基于所述平均环境音量和所述设定语音模式,确定目标语音播放模式。
在本申请的一些实施例中,基于前述方案,所述方法还包括:检测所述第一环境声音和所述第二环境声音中自体发出的语音;从所述第一环境声音和所述第二环境声音中过滤所述自体发出的语音。
根据本申请实施例的一个方面,提供了一种控制音量的装置,包括:获取单元,用于在机器人行进过程中,通过设于所述机器人自身的声音采集装置获取第一环境声音,并获取布设于行进场景中的声音采集装置采集到的第二环境声音;音量确定单元,用于基于所述第一环境声音和所述第二环境声音,确定当前位置处对应的平均环境音量;模式确定单元,用于基于所述平均环境音量,确定目标语音播放模式;播报单元,用于将当前语音播放模式调整为所述目标语音播放模式,并基于所述目标语音播放模式中的音量播报语音。
在本申请的一些实施例中,基于前述方案,所述音量确定单元包括:识别单元,用于识别所述第一环境声音和第二环境声音中的干扰声音频率;滤除单元,用于滤除所述第一环境声音和所述第二环境声音中所述干扰声音频率对应的声音,分别得到第一过滤声音和第二过滤声音;环境音量确定单元,用于基于所述第一过滤声音和所述第二过滤声音,确定当前位置处对应的平均环境音量。
在本申请的一些实施例中,基于前述方案,所述干扰声音频率包括频率大于第一设定频率的超高音量频率、频率小于第二设定频率的超低音量频率;所述识别单元用于:从所述第一环境声音和第二环境声音中提取环境音量特征;基于所述环境音量特征和设定的音频分类模型,识别所述第一环境声音中包含的超高音量频率和超低音量频率、以及所述第二环境声音中包含的超高音量频率和超低音量频率。
在本申请的一些实施例中,基于前述方案,所述环境音量确定单元用于:检测所述第一过滤声音对应的第一音量、以及第二过滤声音对应的第二音量;基于针对机器人自身设定的第一加权系数对所述第一音量进行加权处理,得到第一音量分量;基于针对所述声音采集装置设定的第二加权系数对所述第二音量进行加权处理,得到第二音量分量;基于所述第一音量分量和所述第二音量分量,计算当前位置处对应的平均环境音量。
在本申请的一些实施例中,基于前述方案,所述获取单元包括:装置确定单元,用于基于当前行进位置,确定设定区域范围内的目标声音采集装置;声音获取单元,用于获取所述目标声音采集装置采集到的具有设定时长的第二环境声音。
在本申请的一些实施例中,基于前述方案,所述模式确定单元用于:获取当前行进位置处对应的道路标识,并获取所述道路标识对应的设定语音模式;基于所述平均环境音量和所述设定语音模式,确定目标语音播放模式。
在本申请的一些实施例中,基于前述方案,所述控制音量的装置还用于:检测所述第一环境声音和所述第二环境声音中自体发出的语音;从所述第一环境声音和所述第二环境声音中过滤所述自体发出的语音。
根据本申请实施例的一个方面,提供了一种计算机可读介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上述实施例中所述的控制音量的方法。
根据本申请实施例的一个方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如上述实施例中所述的控制音量的方法。
根据本申请实施例的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的控制音量的方法。
在本申请的一些实施例所提供的技术方案中,在机器人行进过程中,通过设于机器人自身的声音采集装置获取第一环境声音,并获取布设于行进场景中的声音采集装置采集到的第二环境声音,以基于第一环境声音和第二环境声音,确定当前位置处对应的平均环境音量,进而基于平均环境音量,确定目标语音播放模式,最后将当前语音播放模式调整为目标语音播放模式,以基于适应当前环境的音量来播报语音,既可以适当的提醒行人,又不会引起过大的噪声干扰外界环境,提高了机器人播放语音的舒适性,以及机器人音量控制的自适应性和精确性。
应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本申请。
附图说明
此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:
图1示意性示出了根据本申请的一个实施例的控制音量的方法的流程图。
图2示意性示出了根据本申请的一个实施例的控制音量的示意图。
图3示意性示出了根据本申请的一个实施例的确定当前位置处对应的平均环境音量。
图4示意性示出了根据本申请的一个实施例的基于机器人控制音量的应用环境的示意图。
图5示意性示出了根据本申请的一个实施例的控制音量的装置的框图。
图6示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
具体实施方式
现在将参考附图更全面地描述示例实施方式。然而,示例实施方式能够以多种形式实施,且不应被理解为限于在此阐述的范例;相反,提供这些实施方式使得本申请将更加全面和完整,并将示例实施方式的构思全面地传达给本领域的技术人员。
此外,所描述的特征、结构或特性可以以任何合适的方式结合在一个或更多实施例中。在下面的描述中,提供许多具体细节从而给出对本申请的实施例的充分理解。然而,本领域技术人员将意识到,可以实践本申请的技术方案而没有特定细节中的一个或更多,或者可以采用其它的方法、组元、装置、步骤等。在其它情况下,不详细示出或描述公知方法、装置、实现或者操作以避免模糊本申请的各方面。
附图中所示的方框图仅仅是功能实体,不一定必须与物理上独立的实体相对应。即,可以采用软件形式来实现这些功能实体,或在一个或多个硬件模块或集成电路中实现这些功能实体,或在不同网络和/或处理器装置和/或微控制器装置中实现这些功能实体。
附图中所示的流程图仅是示例性说明,不是必须包括所有的内容和操作/步骤,也不是必须按所描述的顺序执行。例如,有的操作/步骤还可以分解,而有的操作/步骤可以合并或部分合并,因此实际执行的顺序有可能根据实际情况改变。
以下对本申请实施例的技术方案的实现细节进行详细阐述:
图1示出了根据本申请的一个实施例的控制音量的方法的流程图,该控制音量的方法可以由服务器来执行,该服务器可以是机器人、移动装置等。参照图1所示,该控制音量的方法至少包括步骤S110至步骤S140,详细介绍如下:
在步骤S110中,在机器人行进过程中,通过设于所述机器人自身的声音采集装置获取第一环境声音,并获取布设于行进场景中的声音采集装置采集到的第二环境声音。
在本申请的一个实施例中,在机器人身上设置有声音采集装置,并且在环境中也设置有声音采集装置,本实施例中的声音采集装置可以为适应传感器等等。
应用在室内移动机器人场景,当机器在室内环境运行,经过公共区域,电梯,到达目的地,需要提醒路人避让或者到达提醒,机器就需要通过发出声音提醒人员。使用该发明,机器就可更加运行的位置和实时的环境音量,调整自身的声音,实现机器与人,环境智能结合,互不干扰,带来人机交互的新体验。
在机器运行环境和机器人身上部署收音传感器,实时收集传递给机器,机器结合自身运行位置,通过大数据和机器学习,计算出当前环境该使用哪种音量模式,动态调整机器模式,更加实时和准确的适应了环境对机器声音的要求。
图2为本申请实施例提供的一种控制音量的示意图。
如图2所示,本实施例中机器人250在行进过程中,通过设于机器人自身的机器人传感器220来获取环境声音,即第一环境声音。同时通过布设于行进场景中的现场音量传感器210来采集环境声音,即第二环境声音。
本实施例中通过在采集不同位置处对应的环境声音,可以全面的获取到环境声音的大小情况,避免从单一位置获取声音的不确定性,提高声音获取的全面性。
在本申请的一个实施例中,获取布设于行进场景中的声音采集装置采集到的第二环境声音,包括:基于当前行进位置,确定设定区域范围内的目标声音采集装置;获取目标声音采集装置采集到的具有设定时长的第二环境声音。
在本申请的一个实施例中,行进场景中的声音采集装置布设于各种位置处,其数量为至少两个。在机器人行进过程中,其周围存在不同的声音采集装置,本实施例中通过设定一个区域范围,使得机器人来获取该区域范围内的目标声音采集装置;获取目标声音采集装置采集到的具有设定时长的第二环境声音。
在本申请的一个实施例中,在确定当前位置处对应的平均环境音量之前,方法还包括:检测第一环境声音和第二环境声音中自体发出的语音;从第一环境声音和第二环境声音中过滤自体发出的语音。通过检测机器人自身的声音,并将自身声音滤除,可以提高声音控制的精确性。
在步骤S120中,基于所述第一环境声音和所述第二环境声音,确定当前位置处对应的平均环境音量。
在本申请的一个实施例中,在获取到第一环境声音和第二环境声音之后,基于第一环境声音和第二环境声音来来确定机器人当前位置处对应的平均环境音量。
在本申请的一个实施例中,如图3所示,步骤S120中基于所述第一环境声音和所述第二环境声音,确定当前位置处对应的平均环境音量的过程,包括步骤S121~S123,详细说明如下:
在步骤S121中,识别所述第一环境声音和第二环境声音中的干扰声音频率。
在本申请的一个实施例中,干扰声音频率包括频率大于第一设定频率的超高音量频率、频率小于第二设定频率的超低音量频率;识别第一环境声音和第二环境声音中的干扰声音频率,包括:从第一环境声音和第二环境声音中提取环境音量特征;基于环境音量特征和设定的音频分类模型,识别第一环境声音中包含的超高音量频率和超低音量频率、以及第二环境声音中包含的超高音量频率和超低音量频率。
在本申请的一个实施例中,具体的,本实施例中的声音特征可以包括声音的音色、频率等特征信息;本实施例中的音频分类模型用于确定各个声音对应的类型或者频率高低等,通过将环境音量特征输入到音频分类模型中,便可以识别到环境声音中的超高音量频率和超低音量频率。
除此之外,本实施例中的干扰声音频率还可以包括噪声等等。
在步骤S122中,滤除所述第一环境声音和所述第二环境声音中所述干扰声音频率对应的声音,分别得到第一过滤声音和第二过滤声音。
在本申请的一个实施例中,在识别到第一环境声音和第二环境声音中干扰声音频率,滤除第一环境声音和第二环境声音中干扰声音频率对应的声音,分别得到第一过滤声音和第二过滤声音。通过上述方式可以得到更加纯净的环境声音,提高声音控制的精确性。
在本申请的一个实施例中,现场和机器的传感器实时收集环境声音,通过提取环境音量特征和设计分类型的音频模型,对收集到的超高音量频率和超低音量频率进行过滤,对机器发出的声音也进行过滤处理,配合上多个位置的传感器,确保在固定范围内的环境音量是真实的。
在步骤S123中,基于所述第一过滤声音和所述第二过滤声音,确定当前位置处对应的平均环境音量。
在本申请的一个实施例中,在得到第一过滤声音和第二过滤声音之后,本实施例中基于第一过滤声音和第二过滤声音,确定当前位置处对应的平均环境音量。
具体的,本实施例中基于第一过滤声音和第二过滤声音,确定当前位置处对应的平均环境音量,包括:检测第一过滤声音对应的第一音量、以及第二过滤声音对应的第二音量;基于针对机器人自身设定的第一加权系数对第一音量进行加权处理,得到第一音量分量;基于针对声音采集装置设定的第二加权系数对第二音量进行加权处理,得到第二音量分量;基于第一音量分量和第二音量分量,计算当前位置处对应的平均环境音量。
请继续参考图2所示,在本申请的一个实施例中,示例性的,当机器运行到某个区域,会获取该区域范围内的传感器最近5分钟内音量数据,加上机器本身传感器收集,环境传感器占比80%,机器传感器占比20%,进行现场音量计算230,计算出该环境的平均音量,跟机器的音量模式进行匹配,得到机器需要音量模式,对机器进行设置,达到实时调整音量240的目的。
在步骤S130中,基于所述平均环境音量,确定目标语音播放模式。
在本申请的一个实施例中,在确定了平均环境音量之后,基于平均环境音量,确定目标语音播放模式。示例性的,若平均环境音量对应的等级为三级,而机器人当前的语音播放模式为二级,则确定目标语音播放模式为三级。其中,语音播放模式的等级对应于播放音量的大小。
在本申请的一个实施例中,基于所述平均环境音量,确定目标语音播放模式,包括:获取当前行进位置处对应的道路标识,并获取所述道路标识对应的设定语音模式;基于所述平均环境音量和所述设定语音模式,确定目标语音播放模式。
本实施例中的语音播放模式中包括了语音播放的音量、频率、语音播放内容以及设定的声道等等。
在本申请的一个实施例中,机器人上设有摄像装置,用于采集当前道路信息,以获取到当前位置处对应的道路标识,并通过机器识别等方式,确定道路标识对应的位置、设定的语音播放模式等信息。
图4为本申请实施例提供的一种基于机器人控制音量的应用环境的示意图。
如图4所示,在机器人420运行的环境中430包括了各种道路,其中,道路中设置有拾音传感器410用于采集环境中的音量。并且,本实施例中的道路中设置有道路标识,用于机器人进行检测,以确定当前道路标识对应的设定语音模式;基于平均环境音量和设定语音模式,确定目标语音播放模式。
除此之外,还可以直接基于当前道路标识设定对应的声音大小,以在行进到该道路标识对应的位置时,直接基于该标识的设定声音大小来进行语音播报。
在步骤S140中,将当前语音播放模式调整为所述目标语音播放模式,并基于所述目标语音播放模式中的音量播报语音。
在本申请的一个实施例中,在确定了目标语音播放模式之后,将当前语音播放模式调整为目标语音播放模式,并基于目标语音播放模式中的音量播报语音。
示例性,本实施例中的机器人可以为搬运物体的机器人,其上承载有需要搬运的获取,且需要在环境中行进,可能会有行人或者障碍物阻挡机器人的行进,机器人在行进过程中也会播报语音来警示行人,在确定了目标语音播放模式,便可以基于目标语音播放模式中的音量来播报语音,即可以适应当前环境中的声音,又可以适当的提醒行人,且不会引起过大的噪声。
本申请实施例通过使用多个环境拾音传感器和机器传感器相结合;对环境音量进行降噪过滤,识别提取出真实的环境音量;机器根据环境音量、场景,实时调整机器的音量模式。
上述方案,在机器人行进过程中,通过设于机器人自身的声音采集装置获取第一环境声音,并获取布设于行进场景中的声音采集装置采集到的第二环境声音,以基于第一环境声音和第二环境声音,确定当前位置处对应的平均环境音量,进而基于平均环境音量,确定目标语音播放模式,最后将当前语音播放模式调整为目标语音播放模式,以基于适应当前环境的音量来播报语音,既可以适当的提醒行人,又不会引起过大的噪声干扰外界环境,提高了机器人播放语音的舒适性,以及机器人音量控制的自适应性和精确性。
以下介绍本申请的装置实施例,可以用于执行本申请上述实施例中的控制音量的方法。对于本申请装置实施例中未披露的细节,请参照本申请上述的控制音量的方法的实施例。
图5示出了根据本申请的一个实施例的控制音量的装置的框图。
参照图5所示,根据本申请的一个实施例的控制音量的装置500,包括:获取单元510,用于在机器人行进过程中,通过设于所述机器人自身的声音采集装置获取第一环境声音,并获取布设于行进场景中的声音采集装置采集到的第二环境声音;音量确定单元520,用于基于所述第一环境声音和所述第二环境声音,确定当前位置处对应的平均环境音量;模式确定单元530,用于基于所述平均环境音量,确定目标语音播放模式;播报单元540,用于将当前语音播放模式调整为所述目标语音播放模式,并基于所述目标语音播放模式中的音量播报语音。
在本申请的一些实施例中,基于前述方案,所述音量确定单元520包括:识别单元,用于识别所述第一环境声音和第二环境声音中的干扰声音频率;滤除单元,用于滤除所述第一环境声音和所述第二环境声音中所述干扰声音频率对应的声音,分别得到第一过滤声音和第二过滤声音;环境音量确定单元,用于基于所述第一过滤声音和所述第二过滤声音,确定当前位置处对应的平均环境音量。
在本申请的一些实施例中,基于前述方案,所述干扰声音频率包括频率大于第一设定频率的超高音量频率、频率小于第二设定频率的超低音量频率;所述识别单元用于:从所述第一环境声音和第二环境声音中提取环境音量特征;基于所述环境音量特征和设定的音频分类模型,识别所述第一环境声音中包含的超高音量频率和超低音量频率、以及所述第二环境声音中包含的超高音量频率和超低音量频率。
在本申请的一些实施例中,基于前述方案,所述环境音量确定单元520用于:检测所述第一过滤声音对应的第一音量、以及第二过滤声音对应的第二音量;基于针对机器人自身设定的第一加权系数对所述第一音量进行加权处理,得到第一音量分量;基于针对所述声音采集装置设定的第二加权系数对所述第二音量进行加权处理,得到第二音量分量;基于所述第一音量分量和所述第二音量分量,计算当前位置处对应的平均环境音量。
在本申请的一些实施例中,基于前述方案,所述获取单元510包括:装置确定单元,用于基于当前行进位置,确定设定区域范围内的目标声音采集装置;声音获取单元,用于获取所述目标声音采集装置采集到的具有设定时长的第二环境声音。
在本申请的一些实施例中,基于前述方案,所述模式确定单元530用于:获取当前行进位置处对应的道路标识,并获取所述道路标识对应的设定语音模式;基于所述平均环境音量和所述设定语音模式,确定目标语音播放模式。
在本申请的一些实施例中,基于前述方案,所述控制音量的装置500还用于:检测所述第一环境声音和所述第二环境声音中自体发出的语音;从所述第一环境声音和所述第二环境声音中过滤所述自体发出的语音。
上述方案,在机器人行进过程中,通过设于机器人自身的声音采集装置获取第一环境声音,并获取布设于行进场景中的声音采集装置采集到的第二环境声音,以基于第一环境声音和第二环境声音,确定当前位置处对应的平均环境音量,进而基于平均环境音量,确定目标语音播放模式,最后将当前语音播放模式调整为目标语音播放模式,以基于适应当前环境的音量来播报语音,既可以适当的提醒行人,又不会引起过大的噪声干扰外界环境,提高了机器人播放语音的舒适性,以及机器人音量控制的自适应性和精确性。
图6示出了适于用来实现本申请实施例的电子设备的计算机系统的结构示意图。
需要说明的是,图6示出的电子设备的计算机系统600仅是一个示例,不应对本申请实施例的功能和使用范围带来任何限制。
如图6所示,计算机系统600包括中央处理单元(Central Processing Unit,CPU)601,其可以根据存储在只读存储器(Read-Only Memory,ROM)602中的程序或者从储存部分608加载到随机访问存储器(Random Access Memory,RAM)603中的程序而执行各种适当的动作和处理,例如执行上述实施例中所述的方法。在RAM 603中,还存储有系统操作所需的各种程序和数据。CPU 601、ROM 602以及RAM 603通过总线604彼此相连。输入/输出(Input/Output,I/O)接口605也连接至总线604。
以下部件连接至I/O接口605:包括键盘、鼠标等的输入部分606;包括诸如阴极射线管(Cathode Ray Tube,CRT)、液晶显示器(Liquid Crystal Display,LCD)等以及扬声器等的输出部分607;包括硬盘等的储存部分608;以及包括诸如LAN(Local Area Network,局域网)卡、调制解调器等的网络接口卡的通信部分609。通信部分609经由诸如因特网的网络执行通信处理。驱动器610也根据需要连接至I/O接口605。可拆卸介质611,诸如磁盘、光盘、磁光盘、半导体存储器等等,根据需要安装在驱动器610上,以便于从其上读出的计算机程序根据需要被安装入储存部分608。
特别地,根据本申请的实施例,上文参考流程图描述的过程可以被实现为计算机软件程序。例如,本申请的实施例包括一种计算机程序产品,其包括承载在计算机可读介质上的计算机程序,该计算机程序包含用于执行流程图所示的方法的计算机程序。在这样的实施例中,该计算机程序可以通过通信部分609从网络上被下载和安装,和/或从可拆卸介质611被安装。在该计算机程序被中央处理单元(CPU)601执行时,执行本申请的系统中限定的各种功能。
需要说明的是,本申请实施例所示的计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质或者是上述两者的任意组合。计算机可读存储介质例如可以是——但不限于——电、磁、光、电磁、红外线、或半导体的系统、装置或器件,或者任意以上的组合。计算机可读存储介质的更具体的例子可以包括但不限于:具有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机访问存储器(RAM)、只读存储器(ROM)、可擦式可编程只读存储器(Erasable Programmable Read Only Memory,EPROM)、闪存、光纤、便携式紧凑磁盘只读存储器(Compact Disc Read-Only Memory,CD-ROM)、光存储器件、磁存储器件、或者上述的任意合适的组合。在本申请中,计算机可读存储介质可以是任何包含或存储程序的有形介质,该程序可以被指令执行系统、装置或者器件使用或者与其结合使用。而在本申请中,计算机可读的信号介质可以包括在基带中或者作为载波一部分传播的数据信号,其中承载了计算机可读的计算机程序。这种传播的数据信号可以采用多种形式,包括但不限于电磁信号、光信号或上述的任意合适的组合。计算机可读的信号介质还可以是计算机可读存储介质以外的任何计算机可读介质,该计算机可读介质可以发送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序。计算机可读介质上包含的计算机程序可以用任何适当的介质传输,包括但不限于:无线、有线等等,或者上述的任意合适的组合。
附图中的流程图和框图,图示了按照本申请各种实施例的系统、方法和计算机程序产品的可能实现的体系架构、功能和操作。其中,流程图或框图中的每个方框可以代表一个模块、程序段、或代码的一部分,上述模块、程序段、或代码的一部分包含一个或多个用于实现规定的逻辑功能的可执行指令。也应当注意,在有些作为替换的实现中,方框中所标注的功能也可以以不同于附图中所标注的顺序发生。例如,两个接连地表示的方框实际上可以基本并行地执行,它们有时也可以按相反的顺序执行,这依所涉及的功能而定。也要注意的是,框图或流程图中的每个方框、以及框图或流程图中的方框的组合,可以用执行规定的功能或操作的专用的基于硬件的系统来实现,或者可以用专用硬件与计算机指令的组合来实现。
描述于本申请实施例中所涉及到的单元可以通过软件的方式实现,也可以通过硬件的方式来实现,所描述的单元也可以设置在处理器中。其中,这些单元的名称在某种情况下并不构成对该单元本身的限定。
根据本申请的一个方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各种可选实现方式中提供的方法。
作为另一方面,本申请还提供了一种计算机可读介质,该计算机可读介质可以是上述实施例中描述的电子设备中所包含的;也可以是单独存在,而未装配入该电子设备中。上述计算机可读介质承载有一个或者多个程序,当上述一个或者多个程序被一个该电子设备执行时,使得该电子设备实现上述实施例中所述的方法。
应当注意,尽管在上文详细描述中提及了用于动作执行的设备的若干模块或者单元,但是这种划分并非强制性的。实际上,根据本申请的实施方式,上文描述的两个或更多模块或者单元的特征和功能可以在一个模块或者单元中具体化。反之,上文描述的一个模块或者单元的特征和功能可以进一步划分为由多个模块或者单元来具体化。
通过以上的实施方式的描述,本领域的技术人员易于理解,这里描述的示例实施方式可以通过软件实现,也可以通过软件结合必要的硬件的方式来实现。因此,根据本申请实施方式的技术方案可以以软件产品的形式体现出来,该软件产品可以存储在一个非易失性存储介质(可以是CD-ROM,U盘,移动硬盘等)中或网络上,包括若干指令以使得一台计算设备(可以是个人计算机、服务器、触控终端、或者网络设备等)执行根据本申请实施方式的方法。
本领域技术人员在考虑说明书及实践这里公开的实施方式后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本技术领域中的公知常识或惯用技术手段。
应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改变。本申请的范围仅由所附的权利要求来限制。

Claims (10)

1.一种控制音量的方法,其特征在于,包括:
在机器人行进过程中,通过设于所述机器人自身的声音采集装置获取第一环境声音,并获取布设于行进场景中的声音采集装置采集到的第二环境声音;
基于所述第一环境声音和所述第二环境声音,确定当前位置处对应的平均环境音量;
基于所述平均环境音量,确定目标语音播放模式;
将当前语音播放模式调整为所述目标语音播放模式,并基于所述目标语音播放模式中的音量播报语音。
2.根据权利要求1所述的方法,其特征在于,基于所述第一环境声音和所述第二环境声音,确定当前位置处对应的平均环境音量,包括:
识别所述第一环境声音和第二环境声音中的干扰声音频率;
滤除所述第一环境声音和所述第二环境声音中所述干扰声音频率对应的声音,分别得到第一过滤声音和第二过滤声音;
基于所述第一过滤声音和所述第二过滤声音,确定当前位置处对应的平均环境音量。
3.根据权利要求2所述的方法,其特征在于,所述干扰声音频率包括频率大于第一设定频率的超高音量频率、频率小于第二设定频率的超低音量频率;
识别所述第一环境声音和第二环境声音中的干扰声音频率,包括:
从所述第一环境声音和第二环境声音中提取环境音量特征;
基于所述环境音量特征和设定的音频分类模型,识别所述第一环境声音中包含的超高音量频率和超低音量频率、以及所述第二环境声音中包含的超高音量频率和超低音量频率。
4.根据权利要求2所述的方法,其特征在于,基于所述第一过滤声音和所述第二过滤声音,确定当前位置处对应的平均环境音量,包括:
检测所述第一过滤声音对应的第一音量、以及第二过滤声音对应的第二音量;
基于针对机器人自身设定的第一加权系数对所述第一音量进行加权处理,得到第一音量分量;
基于针对所述声音采集装置设定的第二加权系数对所述第二音量进行加权处理,得到第二音量分量;
基于所述第一音量分量和所述第二音量分量,计算当前位置处对应的平均环境音量。
5.根据权利要求1所述的方法,其特征在于,获取布设于行进场景中的声音采集装置采集到的第二环境声音,包括:
基于当前行进位置,确定设定区域范围内的目标声音采集装置;
获取所述目标声音采集装置采集到的具有设定时长的第二环境声音。
6.根据权利要求1所述的方法,其特征在于,基于所述平均环境音量,确定目标语音播放模式,包括:
获取当前行进位置处对应的道路标识,并获取所述道路标识对应的设定语音模式;
基于所述平均环境音量和所述设定语音模式,确定目标语音播放模式。
7.根据权利要求1所述的方法,其特征在于,在确定当前位置处对应的平均环境音量之前,所述方法还包括:
检测所述第一环境声音和所述第二环境声音中自体发出的语音;
从所述第一环境声音和所述第二环境声音中过滤所述自体发出的语音。
8.一种控制音量的装置,其特征在于,包括:
获取单元,用于在机器人行进过程中,通过设于所述机器人自身的声音采集装置获取第一环境声音,并获取布设于行进场景中的声音采集装置采集到的第二环境声音;
音量确定单元,用于基于所述第一环境声音和所述第二环境声音,确定当前位置处对应的平均环境音量;
模式确定单元,用于基于所述平均环境音量,确定目标语音播放模式;
播报单元,用于将当前语音播放模式调整为所述目标语音播放模式,并基于所述目标语音播放模式中的音量播报语音。
9.一种计算机可读介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现如权利要求1至7中任一项所述的控制音量的方法。
10.一种机器人,其特征在于,包括:
一个或多个处理器;
存储装置,用于存储一个或多个程序,当所述一个或多个程序被所述一个或多个处理器执行时,使得所述一个或多个处理器实现如权利要求1至7中任一项所述的控制音量的方法。
CN202011228455.0A 2020-11-06 2020-11-06 一种控制音量的方法、装置及计算机可读介质 Active CN112256234B (zh)

Priority Applications (1)

Application Number Priority Date Filing Date Title
CN202011228455.0A CN112256234B (zh) 2020-11-06 2020-11-06 一种控制音量的方法、装置及计算机可读介质

Applications Claiming Priority (1)

Application Number Priority Date Filing Date Title
CN202011228455.0A CN112256234B (zh) 2020-11-06 2020-11-06 一种控制音量的方法、装置及计算机可读介质

Publications (2)

Publication Number Publication Date
CN112256234A CN112256234A (zh) 2021-01-22
CN112256234B true CN112256234B (zh) 2021-07-23

Family

ID=74265233

Family Applications (1)

Application Number Title Priority Date Filing Date
CN202011228455.0A Active CN112256234B (zh) 2020-11-06 2020-11-06 一种控制音量的方法、装置及计算机可读介质

Country Status (1)

Country Link
CN (1) CN112256234B (zh)

Families Citing this family (3)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN113504889B (zh) * 2021-06-25 2025-01-10 和美(深圳)信息技术股份有限公司 机器人音量自动调节方法、装置、电子设备及存储介质
CN115129294A (zh) * 2022-06-24 2022-09-30 杭州海康机器人技术有限公司 音量调节方法、装置及电子设备
CN115641701A (zh) * 2022-10-10 2023-01-24 北京声智科技有限公司 一种事件提醒方法、装置、设备及存储介质

Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103686339A (zh) * 2013-11-14 2014-03-26 乐视致新电子科技(天津)有限公司 一种自适应音量调节方法及装置
CN106528036A (zh) * 2016-10-09 2017-03-22 腾讯科技(深圳)有限公司 音量调节方法及装置
CN107908388A (zh) * 2017-11-17 2018-04-13 珠海市魅族科技有限公司 音量控制方法及装置、计算机装置及计算机可读存储介质
CN108401209A (zh) * 2018-02-08 2018-08-14 青岛海信电器股份有限公司 实现语音播报校正的方法及装置、可读存储介质
CN108681440A (zh) * 2018-04-03 2018-10-19 百度在线网络技术(北京)有限公司 一种智能设备音量控制方法及系统
CN109739097A (zh) * 2018-12-14 2019-05-10 武汉城市职业学院 一种基于嵌入式web的智能家居机器人及其用途
CN110166879A (zh) * 2019-06-28 2019-08-23 歌尔科技有限公司 语音采集控制方法、装置及tws耳机
CN110534110A (zh) * 2018-05-25 2019-12-03 深圳市优必选科技有限公司 一种机器人及提高其语音交互识别率的方法、装置和电路

Family Cites Families (6)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
KR100657912B1 (ko) * 2004-11-18 2006-12-14 삼성전자주식회사 잡음 제거 방법 및 장치
KR100926132B1 (ko) * 2007-08-10 2009-11-11 한국전자통신연구원 로봇 환경에서의 음원 방향 결정 시스템 및 방법
KR101534995B1 (ko) * 2011-02-05 2015-07-07 애플 인크. 모바일 로케이션 결정을 위한 방법 및 장치
US10136234B2 (en) * 2015-05-14 2018-11-20 Harman International Industries, Incorporated Techniques for autonomously calibrating an audio system
JP6532021B2 (ja) * 2015-09-29 2019-06-19 本田技研工業株式会社 音声処理装置及び音声処理方法
CN108388187A (zh) * 2018-04-12 2018-08-10 广东水利电力职业技术学院(广东省水利电力技工学校) 一种机器人控制系统

Patent Citations (8)

* Cited by examiner, † Cited by third party
Publication number Priority date Publication date Assignee Title
CN103686339A (zh) * 2013-11-14 2014-03-26 乐视致新电子科技(天津)有限公司 一种自适应音量调节方法及装置
CN106528036A (zh) * 2016-10-09 2017-03-22 腾讯科技(深圳)有限公司 音量调节方法及装置
CN107908388A (zh) * 2017-11-17 2018-04-13 珠海市魅族科技有限公司 音量控制方法及装置、计算机装置及计算机可读存储介质
CN108401209A (zh) * 2018-02-08 2018-08-14 青岛海信电器股份有限公司 实现语音播报校正的方法及装置、可读存储介质
CN108681440A (zh) * 2018-04-03 2018-10-19 百度在线网络技术(北京)有限公司 一种智能设备音量控制方法及系统
CN110534110A (zh) * 2018-05-25 2019-12-03 深圳市优必选科技有限公司 一种机器人及提高其语音交互识别率的方法、装置和电路
CN109739097A (zh) * 2018-12-14 2019-05-10 武汉城市职业学院 一种基于嵌入式web的智能家居机器人及其用途
CN110166879A (zh) * 2019-06-28 2019-08-23 歌尔科技有限公司 语音采集控制方法、装置及tws耳机

Also Published As

Publication number Publication date
CN112256234A (zh) 2021-01-22

Similar Documents

Publication Publication Date Title
CN112256234B (zh) 一种控制音量的方法、装置及计算机可读介质
CN105662797B (zh) 一种智能物联网导盲杖
CN111354371B (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
CN111124108B (zh) 模型训练方法、手势控制方法、装置、介质及电子设备
CN111402925A (zh) 语音调节的方法、装置、电子设备、车载系统和可读介质
CN107274900B (zh) 用于控制终端的信息处理方法及其系统
US11328518B2 (en) Method and apparatus for outputting information
CN109606384A (zh) 车辆控制方法、装置、设备和存储介质
WO2021159987A1 (zh) 交通工具运行状态的预测方法、装置、终端及存储介质
JP2008058039A (ja) 車載不満情報収集装置、情報収集センタ及び不満情報収集システム
JP6267563B2 (ja) 運転支援装置、及び運転支援方法
CN110880328B (zh) 到站提醒方法、装置、终端及存储介质
CN114741047A (zh) 一种音量调节方法及音量调节系统
CN114684152A (zh) 驾驶体验数据处理的方法、装置、车辆及介质
CN111009261B (zh) 到站提醒方法、装置、终端及存储介质
CN118781565A (zh) 基于车载系统的雨势判断方法、装置、设备及存储介质
CN116161051A (zh) 针对车辆驾驶员的警示方法、装置、设备、介质及车辆
CN115474131A (zh) 音频播放控制方法、装置、车辆及存储介质
CN115119767A (zh) 一种车内宠物的安抚方法、装置、设备及存储介质
CN115394292B (zh) 车辆音频控制方法、装置、车辆及存储介质
CN110941455B (zh) 主动唤醒方法、装置及电子设备
CN115484721A (zh) 基于路侧感知系统的路灯控制方法、装置、设备及介质
JP7100575B2 (ja) 情報処理装置及びプログラム
CN114056249A (zh) 声音传递系统和方法
CN115139897B (zh) 一种会车警示方法、系统、电子设备及存储介质

Legal Events

Date Code Title Description
PB01 Publication
PB01 Publication
SE01 Entry into force of request for substantive examination
SE01 Entry into force of request for substantive examination
GR01 Patent grant
GR01 Patent grant
点击 这是indexloc提供的php浏览器服务,不要输入任何密码和下载