通过语音实现图书查询的方法、系统及装置的制造方法

文档序号：10655368阅读：486来源：国知局

通过语音实现图书查询的方法、系统及装置的制造方法
【专利摘要】本发明公开了一种通过语音实现图书查询的方法、系统及装置，该方法包括：获取用户输入的语音查询信息；将所述语音查询信息转化为文字查询信息；将所述文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书；若能确定用户所要查询的图书，提示用户进行后续操作；若不能确定用户所要查询的图书，提示用户未查询到图书或提示用户重新输入语音查询信息。通过语音输入查询信息，方便快捷的实现图书查询。
【专利说明】
通过语音实现图书查询的方法、系统及装置
技术领域
[0001]本发明涉及语音查询技术领域，特别涉及一种通过语音实现图书查询的方法、系统及装置。
【背景技术】
[0002]随着计算机技术的广泛应用，图书馆中的图书也可以通过在计算机上配置的图书查询系统来实现，用户通过计算机管理系统界面上输入一些查询信息，可以实现对图书的查询，这种方式大大方便了借阅用户查询图书馆中有没有自己感兴趣的图书，同时，也方便了管理用户方便快捷的获取馆藏图书的相关信息。
[0003]但现有的图书管理系统，基本上都是基于键盘输入操作来实现的，需要查询图书信息的用户手动操作键盘，输入必要的查询信息，才能实现对图书的查询，这种方式对于每个用户来说都需要了解如何进行信息输入操作，查询用户的操作技能有一定的要求，对于操作技能水平不高的查询用户，尤其是老年和儿童用户而言，操作这种查询设备比较困难，通常需要花费很长的时间去研究如何进行操作，如何正确输入信息，有时候自己不能完成操作还得求助他人，因此这种图书查询方式因为其操作的复杂性导致其操作的不便利性。
[0004]而且在需要查询图书信息的用户比较多时，往往需要查询用户花费时间排队等候，耗时长，不方便。

【发明内容】

[0005]本发明实施例提供一种通过语音实现图书查询的方法、系统及装置，用以解决现有技术中存在的图书查询操作耗时长、操作复杂、便利性差等问题。
[0006]本发明实施例提供一种通过语音实现图书查询的方法，包括:
[0007]获取用户输入的语音查询信息；
[0008]将所述语音查询信息转化为文字查询信息；
[0009]将所述文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书；
[0010]若能确定用户所要查询的图书，提示用户进行后续操作;若不能确定用户所要查询的图书，提示用户未查询到图书或提示用户重新输入语音查询信息。
[0011 ]在一些可选的实施例中，将所述语音查询信息转化为文字查询信息，具体包括:
[0012]采用选定的声学模型和语言模型，确定与所述语音查询信息匹配度最高的文字查询信息，得到所述语音查询信息对应的为文字查询信息。
[0013]在一些可选的实施例中，所述采用选定的声学模型和语言模型，具体包括:
[0014]针对普通图书馆，采用通用的声学模型和语言模型；
[0015]针对主题图书馆，采用相应主题的声学模型和语言模型。
[0016]在一些可选的实施例中，所述相应主题的声学模型和语言模型是指该主题相关的关键词的权重设置的相对其他关键词高的声学模型和语言模型。
[0017]在一些可选的实施例中，采用选定的声学模型和语言模型，确定与所述语音查询信息匹配度最高的文字查询信息，具体包括:[〇〇18]采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率；
[0019]采用选定的声学模型确定待匹配文字发出语音查询信息这段语音的概率；
[0020]确定待匹配文字的序列本身概率与待匹配文字发出语音查询信息这段语音的概率的乘积最大的待匹配文字为语音查询信息匹配度最高的文字查询信息。
[0021]在一些可选的实施例中，将所述文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书，具体包括:
[0022]将所述文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配；
[0023]若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书；
[0024]若图书基本信息数据中没有相匹配的信息数据，则认为不能确定用户所要查询的图书。
[0025]在一些可选的实施例中，所述图书基本信息数据，包括下列信息中的至少一项:书名、作者、出版社、出版日期、图书条码、本馆中的图书编号。
[0026]在一些可选的实施例中，若图书基本信息数据中没有相匹配的信息数据时，还包括:
[0027]将所述文字查询信息中包括的图书相关的分词与预先建立的图书类型数据和图书关键词数据中的至少一项进行匹配；
[0028]若其中一项能够匹配成功，则认为能确定用户所要查询的图书;若任何一项均不能匹配成功，才认为不能确定用户所要查询的图书。
[0029]在一些可选的实施例中，所述图书类型数据包括根据图书分类规则对本馆图书进行分类后得到的所有图书类型信息；
[0030]图书关键词数据根据设定的规则选取书中出现频率最高的设定数量的词汇或选取书名或摘要部分的词汇。
[0031]在一些可选的实施例中，所述获取用户输入的语音查询信息，具体包括:
[0032]获取用户通过本地输入接口输入的语音查询信息;或
[0033]获取用户通过查询终端输入并通过无线网络或有线网络发送过来的语音查询信息。
[0034]本发明实施例还提供一种通过语音实现图书查询的系统，包括:查询终端和查询服务器；
[0035]所述查询终端，用于获取用户输入的语音查询信息，并发送给查询服务器；以及根据查询服务器的通知，提示用户进行后续操作，或提示用户未查询到图书，或提示用户重新输入语音查询信息；
[0036]所述查询服务器，用于接收查询终端发送过来的语音查询信息，将所述语音查询信息转化为文字查询信息；将所述文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书;若能确定用户所要查询的图书，通知查询终端提示用户进行后续操作;若不能确定用户所要查询的图书，通知查询终端提示用户未查询到图书或提示用户重新输入语音查询信息。
[0037]在一些可选的实施例中，所述查询服务器，具体用于:
[0038]采用选定的声学模型和语言模型，确定与所述语音查询信息匹配度最高的文字查询信息，得到所述语音查询信息对应的为文字查询信息。
[0039]在一些可选的实施例中，所述查询服务器，具体用于:
[0040]针对普通图书馆，采用通用的声学模型和语言模型；
[0041]针对主题图书馆，采用相应主题的声学模型和语言模型。
[0042]在一些可选的实施例中，所述查询服务器，具体用于:
[0043]采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率；
[0044]采用选定的声学模型确定待匹配文字发出语音查询信息这段语音的概率；
[0045]确定待匹配文字的序列本身概率与待匹配文字发出语音查询信息这段语音的概率的乘积最大的待匹配文字为语音查询信息匹配度最高的文字查询信息。
[0046]在一些可选的实施例中，所述查询服务器，具体用于:
[0047]将所述文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配;若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书；
[0048]若图书基本信息数据中没有相匹配的信息数据，则认为不能确定用户所要查询的图书。
[0049]在一些可选的实施例中，所述查询服务器，还用于:
[0050]若图书基本信息数据中没有相匹配的信息数据时，将所述文字查询信息中包括的图书相关的分词与预先建立的图书类型数据和图书关键词数据中的至少一项进行匹配；
[0051]若其中一项能够匹配成功，则认为能确定用户所要查询的图书;若任何一项均不能匹配成功，才认为不能确定用户所要查询的图书。
[0052]本发明实施例还提供一种通过语音实现图书查询的装置，包括:
[0053]获取模块，用于获取用户输入的语音查询信息；
[0054]转化模块，用于将所述语音查询信息转化为文字查询信息；
[0055]查询模块，用于将所述文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书；
[0056]执行模块，用于若能确定用户所要查询的图书，提示用户进行后续操作;若不能确定用户所要查询的图书，提示用户未查询到图书或提示用户重新输入语音查询信息。
[0057]在一些可选的实施例中，所述转化模块，具体用于:
[0058]采用选定的声学模型和语言模型，确定与所述语音查询信息匹配度最高的文字查询信息，得到所述语音查询信息对应的为文字查询信息。
[0059]在一些可选的实施例中，所述转化模块，具体用于:
[0060]针对普通图书馆，采用通用的声学模型和语言模型；
[0061]针对主题图书馆，采用相应主题的声学模型和语言模型。
[0062]在一些可选的实施例中，所述转化模块，具体用于:
[0063]采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率；
[0064]采用选定的声学模型确定待匹配文字发出语音查询信息这段语音的概率；
[0065]确定待匹配文字的序列本身概率与待匹配文字发出语音查询信息这段语音的概率的乘积最大的待匹配文字为语音查询信息匹配度最高的文字查询信息。
[0066]在一些可选的实施例中，所述查询模块，具体用于:
[0067]将所述文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配;若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书；
[0068]若图书基本信息数据中没有相匹配的信息数据，则认为不能确定用户所要查询的图书。[〇〇69] 在一些可选的实施例中，所述查询模块，还用于:
[0070]若图书基本信息数据中没有相匹配的信息数据时，将所述文字查询信息中包括的图书相关的分词与预先建立的图书类型数据和图书关键词数据中的至少一项进行匹配；
[0071]若其中一项能够匹配成功，则认为能确定用户所要查询的图书;若任何一项均不能匹配成功，才认为不能确定用户所要查询的图书。
[0072]在一些可选的实施例中，所述获取模块，具体用于:
[0073]获取用户通过本地输入接口输入的语音查询信息;或获取用户通过查询终端输入并通过无线通信网络发送过来的语音查询信息；
[0074]所述执行模块，具体用于当所述获取模块获取所述查询终端发送的语音查询信息时，若能确定用户所要查询的图书，通知所述查询终端提示用户进行后续操作;若不能确定用户所要查询的图书，通知所述查询终端提示用户未查询到图书或提示用户重新输入语音查询信息。
[0075]本发明实施例提供的通过语音实现图书查询的方法、系统及装置，通过语音的方式输入语音查询信息，由查询终端或系统对语音进行处理，转化为文字查询信息，并根据文字查询信息自动匹配图书基本信息数据，来确定所要查询的图书，并将提示结果反馈给用户，提示用户后续操作，在无法正确查询到用户所需要的图书时，允许用户重新输入查询信息，这种方式降低了对用户操作技能的要求，降低了用户操作的复杂程度，便利了用户操作，减少了用户查询耗时，提高了速度和效率。
[0076]本发明的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本发明而了解。本发明的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
[0077]下面通过附图和实施例，对本发明的技术方案做进一步的详细描述。【附图说明】[〇〇78]附图用来提供对本发明的进一步理解，并且构成说明书的一部分，与本发明的实施例一起用于解释本发明，并不构成对本发明的限制。在附图中:
[0079]图1为本发明实施例一中通过语音实现图书查询的方法流程图；
[0080]图2为本发明实施例二中通过语音实现图书查询的方法流程图；
[0081]图3为本发明实施例三中通过语音实现图书查询的方法流程图；
[0082]图4为本发明实施例四中通过语音实现图书查询的方法流程图；
[0083]图5为本发明实施例中通过语音实现图书查询的装置结构示意图；
[0084]图6为本发明实施例中通过语音实现图书查询的系统结构示意图。
【具体实施方式】
[0085]以下结合附图对本发明的优选实施例进行说明，应当理解，此处所描述的优选实施例仅用于说明和解释本发明，并不用于限定本发明。
[0086]为了解决现有技术中的问题，本发明实施例提供一种通过语音实现图书查询的方法，能够允许用户以语音的方式输入查询信息，由系统或终端设备进行转化，并根据转化后的文字信息匹配查询图书，确定用户所需要查询的图书，这种基于语音的图书查询方法，避免了复杂的键盘操作，降低了对操作技能的要求，便利了用户操作，减少了不必要的等候时间，降低了查询耗时，其实现简单、方便，能够实现快捷、高效的图书查询。
[0087]实施例一
[0088]本发明实施例一提供一种通过语音实现图书查询的方法，其流程如图1所示，包括如下步骤:
[0089]步骤SlOl:获取用户输入的语音查询信息。
[0090]用户可以通过设备上的语音输入接口或语音输入模块录入语音，实现语音查询信息的输入。获取用户输入的语音查询信息可以是处理语音查询信息的设备直接获取，也可以是处理语音查询信息的设备获取其他设备发送的语音查询信息。
[0091]例如:可以通过单独设置的查询终端实现，其中设置语音查询实现装置，此时由查询终端直接获取用户输入的语音查询信息，并进行后续处理。
[0092]又例如:也可以通过一个语音查询实现系统实现，该系统由至少一个查询服务器处理用户输入的语音查询信息并提供处理结果，由若干的查询终端来接收用户输入的语音查询信息，并与用户实现后续处理结果的交互。
[0093]步骤S102:将获取到的语音查询信息转化为文字查询信息。
[0094]针对输入的语音查询信息，找到一个与之匹配度最高的文字序列，实现语音到文字的转化，得到文字查询信息，其中匹配度可以用概率表示。例如用Y表示语音查询信息，W表示文字查询信息，则是要找到与Y匹配度最高的W。
[0095]可以采用选定的声学模型和语言模型，确定与输入的语音查询信息匹配度最高的文字查询信息，得到语音查询信息对应的为文字查询信息。其中，选定的声学模型和语言模型是指根据图书馆的不同，可以采用不同的声学模型和语言模型。
[0096]比如:针对普通图书馆，采用通用的声学模型和语言模型；针对主题图书馆，采用相应主题的声学模型和语言模型。其中，相应主题的声学模型和语言模型是指该主题相关的关键词的权重设置的相对其他关键词高的声学模型和语言模型。由于是要实现查询操作，因此在进行语音到文字的转化时，可以优选的考虑将主题相关的关键词的权重设置的相对其他关键词高一些，从而能够实现更好的匹配结果。
[0097]步骤S103:将转化出的文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书。若能确定用户所要查询的图书，执行步骤S104;若不能确定用户所要查询的图书，执行步骤S105。
[0098]将转化出的文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配;若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书;若图书基本信息数据中没有相匹配的信息数据，则认为不能确定用户所要查询的图书。
[0099]为了实现查询匹配，可以预先存储图书基本信息数据，针对图书馆中已有的图书收集基本信息数据，并建立数据库进行存储，以便用于查询匹配。当需要进行查询匹配时，将文字查询信息中包含的图书相关的分词逐一与存储的图书基本信息数据进行匹配，可以设定有其中一个分词或设定数量的几个分词能够与存储图书基本信息数据中的图书基本信息数据的信息相匹配，即认为能够确定用户所要查询的图书。
[0100]当有一个分词能够与存储图书基本信息数据中的图书基本信息数据的信息相匹配，可以认为能够确定用户查询的图书;但通常为了准确的确定用户所要查询的图书，通常可以考虑有两个或两个以上的分词能够与存储图书基本信息数据中的图书基本信息数据的信息相匹配时，才认为能够确定用户查询的图书。具体如何设置，可以根据需求选择不同的方案，比如粗略匹配即可的情况下，可以选择一个，需要准确匹配时，可以选择多个。
[0101]图书基本信息数据包括下列信息中的至少一项:书名、作者、出版社、出版日期、图书条码、本馆中的图书编号。
[0102]步骤S104:提示用户进行后续操作。
[0103]当能够确定用户所要查询的图书时，将查询结果告知用户，并允许用户选择后续操作。例如是否借阅查询到的图书。
[0104]当查询结果为多本图书时，可以将查询到的图书提供给用户，供用户从中选择。例如供用户从查询到的多本图书中选择自己想要借阅的图书。
[0105]步骤S105:提示用户未查询到图书或提示用户重新输入语音查询信息。
[0106]当不能够确定用户所要查询的图书时，可以向用户输出未查询到相关图书的查询结果，也可以向用户提供重新输入查询信息的提示操作，以便用户能够输入更多、更准确的信息，来准确匹配图书。
[0107]本发明实施例提供的技术方案，通过语音的方式输入语音查询信息，由查询终端或系统对语音进行处理，转化为文字查询信息，并根据文字查询信息自动匹配图书基本信息数据，来确定所要查询的图书，并将提示结果反馈给用户，提示用户后续操作，在无法正确查询到用户所需要的图书时，允许用户重新输入查询信息，这种方式降低了对用户操作技能的要求，降低了用户操作的复杂程度，便利了用户操作，减少了用户查询耗时，提高了速度和效率。
[0108]实施例二
[0109]本发明实施例二提供一种通过语音实现图书查询的方法，其流程如图2所示，包括如下步骤:
[0110]步骤S201:查询终端获取用户输入的语音查询信息。
[0111]由设置在查询终端上的语音查询实现装置获取用户输入的语音查询信息，语音查询实现装置上可以设置语音录入模块语音录入接口来实现语音录入。
[0112]步骤S202:查询终端采用选定的声学模型和语言模型，确定与获取的语音查询信息匹配度最高的文字查询信息。
[0113]确定与获取的语音查询信息匹配度最高的文字查询信息，通常是通过概率的高低来体现的，本申请以通过文字序列本身的概率和文字序列发出指定语音的概率来体现。具体的，采用查询的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率;采用选定的声学模型确定待匹配文字发出语音查询信息这段语音的概率;确定待匹配文字的序列本身概率与待匹配文字发出语音查询信息这段语音的概率的乘积最大的待匹配文字为语音查询信息匹配度最高的文字查询信息。
[0114]语言模型确定待匹配文字的序列本身概率时，可以将待匹配文字的序列本身概率由其中每个分词的概率之积来表征。每一个分词的概率通常是由该分词相对于所有当前已知词的概率来体现。
[0115]声学模型确定待匹配文字发出获取到的语音查询信息这段语音的概率。可以通过词典把待匹配文字中的各个分词转换成音符串，词典可以向声学模型提供每个分词的发音，并利用一定的算法将各分词的发音组合起来，由声学模型确定待匹配文字发出获取到的语音查询信息这一串音符的概率。
[0116]步骤S203:查询终端根据匹配度最高的文字查询信息，生成语音查询信息对应的为文字查询信息。
[0117]步骤S204:查询终端将转化出的文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配;若图书基本信息数据中有相匹配的信息数据，执行步骤S205 ；若没有，执行步骤S206。
[0118]若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书;若图书基本信息数据中没有相匹配的信息数据，则认为不能确定用户所要查询的图书。实现根据转化出的文字查询信息中包括的图书相关的分词，查询匹配对应的图书。
[0119]步骤S205:查询终端提示用户进行后续操作。
[0120]若图书基本信息数据中有相匹配的信息数据，认为能确定用户所要查询的图书，引导用户对匹配出的图书进行相关操作，例如直接借阅查询到的图书，或者选择查询到的图书中的一本或几本在进行节约操作，也可以导出查询到的图书信息，以备后续使用。
[0121]步骤S206:查询终端提示用户未查询到图书或提示用户重新输入语音查询信息。
[0122]若图书基本信息数据中没有相匹配的信息数据，认为不能确定用户所要查询的图书，可以向用户输出未查询到相关图书的查询结果，也可以向用户提供重新输入查询信息的提示操作，以便用户能够输入更多、更准确的信息，来准确匹配图书。
[0123]本发明实施例提供的技术方案，使用单独设置的查询终端，设置方便，不需要其他设备配合即可单独实现图书查询操作。
[0124]实施例三
[0125]本发明实施例三提供的通过语音实现图书查询，其流程如图3所示，仍以单独设置的查询终端执行基于语音的图书查询实现方法为例，该方法包括如下步骤:
[0126]步骤S301:查询终端获取用户输入的语音查询信息。
[0127]由设置在查询终端上的语音查询实现装置获取用户输入的语音查询信息，语音查询实现装置上可以设置语音录入模块语音录入接口来实现语音录入。
[0128]步骤S302:查询终端采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率。
[0129]如上边实施例中所描述的，针对不同类型的图书馆，对图书查询操作，可以采用不同的语言模块，对于普通图书馆可以采用通用的语言模型，对于主题图书馆可以采用主题相关的分词的权重高于其他关键词的语言模型，将待匹配文字拆分为若干分词，计算每个分词相对于所有当前已知词的概率，然后在计算出每个分词的得到的概率之积，通过计算得到待匹配文字的序列本身概率。
[0130]步骤S303:查询终端采用选定的声学模型确定待匹配文字发出语音查询信息这段语音的概率。
[0131]如上边实施例中所描述的，针对不同类型的图书馆，对图书查询操作，可以采用不同的声学模块，对于普通图书馆可以采用通用的声学模型，对于主题图书馆可以采用主题相关的声学模型。通过存储的词典，将待匹配文字的每个分词转化为音符，将所有的音符组合成音符串，待匹配文字发出语音查询信息这段语音的概率即表征了音符串与语音查询信息这段语音的吻合程度。
[0132] 步骤S302和步骤S303执行顺序不分先后，可以交换。
[0133]步骤S304:查询终端确定待匹配文字的序列本身概率与待匹配文字发出语音查询信息这段语音的概率的乘积最大的待匹配文字为语音查询信息匹配度最高的文字查询信息。
[0134]步骤S302-步骤S304实现了查询终端采用选定的声学模型和语言模型，确定与获取的语音查询信息匹配度最高的文字查询信息。可参照实施例一和实施例二的描述。
[0135]步骤S305:查询终端根据匹配度最高的文字查询信息，生成语音查询信息对应的为文字查询信息。
[0136]步骤S302-步骤S305实现查询终端将接收到语音查询信息转化为文字查询信息的过程。
[0137]步骤S306:查询终端将转化出的文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配。若图书基本信息数据中有相匹配的信息数据，执行步骤 S309;若图书基本信息数据中没有相匹配的信息数据，执行步骤S307。
[0138]若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书;若图书基本信息数据中没有相匹配的信息数据，可以进一步确认能否通过其他方式查询匹配用户想要查询的图书。
[0139]步骤S307:查询终端将转化出的文字查询信息中包括的图书相关的分词与预先建立的图书类型数据和图书关键词数据中的至少一项进行匹配。
[0140]当匹配不到图书基本信息数据时，可以进一步考虑匹配图书类型数据和图书关键词数据，这两种数据可以选择其中之一进行匹配，当匹配成功时，不再匹配另一种。也可以两种都进行匹配，综合考虑匹配结果。[〇141]图书类型数据可以根据图书馆中已有图书的分类收集并建立相关数据库，图书关键词数据根据已有图书选定部分的关键词或出现频率高的关键词建立相关数据库。
[0142]图书类型数据包括根据图书分类规则对本馆图书进行分类后得到的所有图书类型信息；图书关键词数据根据设定的规则选取书中出现频率最高的设定数量的词汇或选取书名或摘要部分的词汇。
[0143]例如:当匹配不到图书基本信息数据时，优先选择匹配图书类型数据，将文字查询信息中图书相关的分词与图书类型数据进行匹配，已确定图书的类型;然后在该类型范围内，再匹配图书关键字，将文字查询信息中图书相关的分词与图书关键字数据进行匹配，以确定要查询的图书。此时优选的，可以优先匹配在进行图书类型数据匹配时未采用的分词
[0144]步骤S308:是否有其中一项能够匹配成功。若是，执行步骤S309;若否，执行步骤S310o
[0145]若其中一项能够匹配成功，则认为能确定用户所要查询的图书;若任何一项均不能匹配成功，才认为不能确定用户所要查询的图书。
[0146]上述实施例一和实施例二中在匹配图书基本信息数据后，也可以进一步匹配图书类型数据和图书关键词数据，来确定想要查询的图书。
[0147]步骤S306-步骤S308实现根据转化出的文字查询信息中包括的图书相关的分词，确定用户所要查询的图书。
[0148]步骤S309:查询终端提示用户进行后续操作。
[0149]若能确定用户所要查询的图书，引导用户对匹配出的图书进行相关操作，例如直接借阅查询到的图书，或者选择查询到的图书中的一本或几本在进行节约操作，也可以导出查询到的图书信息，以备后续使用。
[0150]步骤S310:查询终端提示用户未查询到图书或提示用户重新输入语音查询信息。
[0151]实施例四
[0152]本发明实施例四提供的通过语音实现图书查询的方法，其流程如图4所示，由查询终端和查询服务器组成的系统实现基于语音的图书查询，该方法包括如下步骤:
[0153]步骤S401:查询终端获取用户输入的语音查询信息并发送给查询服务器。
[0154]查询终端可以设置多个，每个查询终端都可以采集用户的语音查询信息并提供给查询服务器。这样通过一个后台处理设备，处理分散到多个查询地点的查询终端采集的语音查询信息，并进行处理。
[0155]步骤S402:查询服务器接收查询终端发送的语音查询信息。
[0156]查询服务器可以通过无线通信网络或有线互联网实现语音查询信息的接收，以及后续的信息交互。
[0157]步骤S403:查询服务器采用选定的声学模型和语言模型，确定与语音查询信息匹配度最高的文字查询信息。
[0158]参照实施例一和实施例二的描述。
[0159]步骤S404:查询服务器根据匹配度最高的文字查询信息，生成语音查询信息对应的为文字查询信息。
[0160]步骤S403和S404实现查询服务器将接收到语音查询信息转化为文字查询信息的过程。
[0161]步骤S405:查询服务器将转化出的文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配。若图书基本信息数据中有相匹配的信息数据，执行步骤S408;若图书基本信息数据中没有相匹配的信息数据，执行步骤S406。
[0162]若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书;若图书基本信息数据中没有相匹配的信息数据，可以进一步确认能否通过其他方式查询匹配用户想要查询的图书。
[0163]步骤S406:查询终端将转化出的文字查询信息中包括的图书相关的分词与预先建立的图书类型数据和图书关键词数据中的至少一项进行匹配。
[0164]当匹配不到图书基本信息数据时，可以进一步考虑匹配图书类型数据和图书关键词数据，这两种数据可以选择其中之一进行匹配，当匹配成功时，不再匹配另一种。也可以两种都进行匹配，综合考虑匹配结果。
[0165]具体可以参照实施例三中相关步骤的描述。
[0166]步骤S407:是否有其中一项能够匹配成功。若是，执行步骤S408;若否，执行步骤 S409〇
[0167]若其中一项能够匹配成功，则认为能确定用户所要查询的图书;若任何一项均不能匹配成功，才认为不能确定用户所要查询的图书。
[0168]上述实施例一和实施例二中在匹配图书基本信息数据后，也可以进一步匹配图书类型数据和图书关键词数据，来确定想要查询的图书。
[0169]步骤S405-步骤S407实现根据转化出的文字查询信息中包括的图书相关的分词，确定用户所要查询的图书。[〇17〇]步骤S408:查询服务器通知查询终端提示用户进行后续操作。
[0171]查询服务器可以通过有线网络或无线网络通知查询终端。
[0172]步骤S409:查询终端提示用户进行后续操作。
[0173]查询终端根据查询服务器的通知执行相应的后续操作。即若能确定用户所要查询的图书，引导用户对匹配出的图书进行相关操作，例如直接借阅查询到的图书，或者选择查询到的图书中的一本或几本在进行节约操作，也可以导出查询到的图书信息，以备后续使用。
[0174]步骤S410:查询服务器通知查询终端提示用户未查询到图书或提示用户重新输入语音查询信息。
[0175]步骤S411:查询终端提示用户未查询到图书或提示用户重新输入语音查询信息。
[0176]查询服务器将处理结果提供给查询终端，由查询终端与用户实现交互。
[0177]本发明实施例提供的技术方案，通过系统实现语音查询，由一个统一的服务器处理语音信息，减轻查询终端的负担。
[0178]基于同一发明构思，本发明实施例还提供一种通过语音实现图书查询的装置，该装置可以设置在查询终端中，其结构如图5所示，包括:获取模块501、转化模块502、查询模块503和执行模块504。
[0179]获取模块501，用于获取用户输入的语音查询信息。[〇18〇]转化模块502，用于将获取的语音查询信息转化为文字查询信息。
[0181]查询模块503,用于将转化出的文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书。
[0182]执行模块504,用于若能确定用户所要查询的图书，提示用户进行后续操作;若不能确定用户所要查询的图书，提示用户未查询到图书或提示用户重新输入语音查询信息。
[0183]优选的，上述转化模块502,具体用于采用选定的声学模型和语言模型，确定与获取的语音查询信息匹配度最高的文字查询信息，得到语音查询信息对应的为文字查询信息。
[0184]优选的，上述转化模块502，具体用于针对普通图书馆，采用通用的声学模型和语言模型;针对主题图书馆，采用相应主题的声学模型和语言模型。
[0185]优选的，上述转化模块502，具体用于采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率;采用选定的声学模型确定待匹配文字发出语音查询信息这段语音的概率;确定待匹配文字的序列本身概率与待匹配文字发出语音查询信息这段语音的概率的乘积最大的待匹配文字为语音查询信息匹配度最高的文字查询信息。
[0186]优选的，上述查询模块503，具体用于将文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配;若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书;若图书基本信息数据中没有相匹配的信息数据，则认为不能确定用户所要查询的图书。
[0187]优选的，上述查询模块503，还用于若图书基本信息数据中没有相匹配的信息数据时，将文字查询信息中包括的图书相关的分词与预先建立的图书类型数据和图书关键词数据中的至少一项进行匹配;若其中一项能够匹配成功，则认为能确定用户所要查询的图书；若任何一项均不能匹配成功，才认为不能确定用户所要查询的图书。
[0188]优选的，上述获取模块501，具体用于获取用户通过本地输入接口输入的语音查询信息;或获取用户通过查询终端输入并通过无线通信网络发送过来的语音查询信息。
[0189]相应的，上述执行模块504，具体用于当获取模块501获取查询终端发送的语音查询信息时，若能确定用户所要查询的图书，通知查询终端提示用户进行后续操作;若不能确定用户所要查询的图书，通知查询终端提示用户未查询到图书或提示用户重新输入语音查询信息。
[0190]基于同一发明构思，本发明实施例还提供一种通过语音实现图书查询的系统，该系统结构如图6所示，包括:查询终端601和查询服务器602。
[0191]查询终端601，用于获取用户输入的语音查询信息，并发送给查询服务器602;以及根据查询服务器602的通知，提示用户进行后续操作，或提示用户未查询到图书，或提示用户重新输入语音查询信息。
[0192]查询服务器602，用于接收查询终端601发送过来的语音查询信息，将接收到的语音查询信息转化为文字查询信息;将文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书;若能确定用户所要查询的图书，通知查询终端601提示用户进行后续操作;若不能确定用户所要查询的图书，通知查询终端601提示用户未查询到图书或提示用户重新输入语音查询信息。
[0193]优选的，上述查询服务器602，具体用于采用选定的声学模型和语言模型，确定与语音查询信息匹配度最高的文字查询信息，得到语音查询信息对应的为文字查询信息。
[0194]优选的，上述查询服务器602，具体用于针对普通图书馆，采用通用的声学模型和语言模型;针对主题图书馆，采用相应主题的声学模型和语言模型。
[0195]优选的，上述查询服务器602，具体用于采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率;采用选定的声学模型确定待匹配文字发出语音查询信息这段语音的概率;确定待匹配文字的序列本身概率与待匹配文字发出语音查询信息这段语音的概率的乘积最大的待匹配文字为语音查询信息匹配度最高的文字查询信息。
[0196]优选的，上述查询服务器602,具体用于将文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配;若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书;若图书基本信息数据中没有相匹配的信息数据，则认为不能确定用户所要查询的图书。
[0197]优选的，上述查询服务器602,还用于若图书基本信息数据中没有相匹配的信息数据时，将文字查询信息中包括的图书相关的分词与预先建立的图书类型数据和图书关键词数据中的至少一项进行匹配;若其中一项能够匹配成功，则认为能确定用户所要查询的图书;若任何一项均不能匹配成功，才认为不能确定用户所要查询的图书。
[0198]也可以认为查询服务器602中设置有类似于图5所示的语音查询实现装置，只不过其中的获取模块，获取的用户通过查询终端601输入的语音查询信息;其中的执行模块在若能确定用户所要查询的图书，通知查询终端601来提示用户进行后续操作;若不能确定用户所要查询的图书，通知查询终端601来提示用户未查询到图书或提示用户重新输入语音查询信息。
[0199]本领域内的技术人员应明白，本发明的实施例可提供为方法、系统、或计算机程序产品。因此，本发明可采用完全硬件实施例、完全软件实施例、或结合软件和硬件方面的实施例的形式。而且，本发明可采用在一个或多个其中包含有计算机可用程序代码的计算机可用存储介质(包括但不限于磁盘存储器和光学存储器等)上实施的计算机程序产品的形式。
[0200]本发明是参照根据本发明实施例的方法、设备(系统)、和计算机程序产品的流程图和/或方框图来描述的。应理解可由计算机程序指令实现流程图和/或方框图中的每一流程和/或方框、以及流程图和/或方框图中的流程和/或方框的结合。可提供这些计算机程序指令到通用计算机、专用计算机、嵌入式处理机或其他可编程数据处理设备的处理器以产生一个机器，使得通过计算机或其他可编程数据处理设备的处理器执行的指令产生用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的装置。
[0201]这些计算机程序指令也可存储在能引导计算机或其他可编程数据处理设备以特定方式工作的计算机可读存储器中，使得存储在该计算机可读存储器中的指令产生包括指令装置的制造品，该指令装置实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能。
[0202]这些计算机程序指令也可装载到计算机或其他可编程数据处理设备上，使得在计算机或其他可编程设备上执行一系列操作步骤以产生计算机实现的处理，从而在计算机或其他可编程设备上执行的指令提供用于实现在流程图一个流程或多个流程和/或方框图一个方框或多个方框中指定的功能的步骤。
[0203]显然，本领域的技术人员可以对本发明进行各种改动和变型而不脱离本发明的精神和范围。这样，倘若本发明的这些修改和变型属于本发明权利要求及其等同技术的范围之内，则本发明也意图包含这些改动和变型在内。
【主权项】
1.一种通过语音实现图书查询的方法，其特征在于，包括:获取用户输入的语音查询信息；将所述语音查询信息转化为文字查询信息；将所述文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书；若能确定用户所要查询的图书，提示用户进行后续操作；若不能确定用户所要查询的图书，提示用户未查询到图书或提示用户重新输入语音查询信息。2.如权利要求1所述的方法，其特征在于，将所述语音查询信息转化为文字查询信息，具体包括:采用选定的声学模型和语言模型，确定与所述语音查询信息匹配度最高的文字查询信息，得到所述语音查询信息对应的为文字查询信息。3.如权利要求2所述的方法，其特征在于，所述采用选定的声学模型和语言模型，具体包括:针对普通图书馆，采用通用的声学模型和语言模型；针对主题图书馆，采用相应主题的声学模型和语言模型。4.如权利要求3所述的方法，其特征在于，所述相应主题的声学模型和语言模型是指该主题相关的关键词的权重设置的相对其他关键词高的声学模型和语言模型。5.如权利要求2所述的方法，其特征在于，采用选定的声学模型和语言模型，确定与所述语音查询信息匹配度最高的文字查询信息，具体包括:采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率；采用选定的声学模型确定待匹配文字发出语音查询信息这段语音的概率；确定待匹配文字的序列本身概率与待匹配文字发出语音查询信息这段语音的概率的乘积最大的待匹配文字为语音查询信息匹配度最高的文字查询信息。6.如权利要求1所述的方法，其特征在于，将所述文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书，具体包括:将所述文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配；若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书；若图书基本信息数据中没有相匹配的信息数据，则认为不能确定用户所要查询的图书。7.如权利要求6所述的方法，其特征在于，所述图书基本信息数据，包括下列信息中的至少一项:书名、作者、出版社、出版日期、图书条码、本馆中的图书编号。8.如权利要求6所述的方法，其特征在于，若图书基本信息数据中没有相匹配的信息数据时，还包括:将所述文字查询信息中包括的图书相关的分词与预先建立的图书类型数据和图书关键词数据中的至少一项进行匹配；若其中一项能够匹配成功，则认为能确定用户所要查询的图书;若任何一项均不能匹配成功，才认为不能确定用户所要查询的图书。9.如权利要求8所述的方法，其特征在于，所述图书类型数据包括根据图书分类规则对本馆图书进行分类后得到的所有图书类型信息；图书关键词数据根据设定的规则选取书中出现频率最高的设定数量的词汇或选取书名或摘要部分的词汇。10.如权利要求1-9任一所述的方法，其特征在于，所述获取用户输入的语音查询信息，具体包括: 获取用户通过本地输入接口输入的语音查询信息;或获取用户通过查询终端输入并通过无线网络或有线网络发送过来的语音查询信息。11.一种通过语音实现图书查询的系统，其特征在于，包括:查询终端和查询服务器；所述查询终端，用于获取用户输入的语音查询信息，并发送给查询服务器；以及根据查询服务器的通知，提示用户进行后续操作，或提示用户未查询到图书，或提示用户重新输入语音查询信息；所述查询服务器，用于接收查询终端发送过来的语音查询信息，将所述语音查询信息转化为文字查询信息；将所述文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书;若能确定用户所要查询的图书，通知查询终端提示用户进行后续操作;若不能确定用户所要查询的图书，通知查询终端提示用户未查询到图书或提示用户重新输入语音查询信息。12.如权利要求11所述的系统，其特征在于，所述查询服务器，具体用于: 采用选定的声学模型和语言模型，确定与所述语音查询信息匹配度最高的文字查询信息，得到所述语音查询信息对应的为文字查询信息。13.如权利要求12所述的系统，其特征在于，所述查询服务器，具体用于: 针对普通图书馆，采用通用的声学模型和语言模型；针对主题图书馆，采用相应主题的声学模型和语言模型。14.如权利要求12所述的系统，其特征在于，所述查询服务器，具体用于: 采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率；采用选定的声学模型确定待匹配文字发出语音查询信息这段语音的概率；确定待匹配文字的序列本身概率与待匹配文字发出语音查询信息这段语音的概率的乘积最大的待匹配文字为语音查询信息匹配度最高的文字查询信息。15.如权利要求11所述的系统，其特征在于，所述查询服务器，具体用于: 将所述文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配;若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书；若图书基本信息数据中没有相匹配的信息数据，则认为不能确定用户所要查询的图书。16.如权利要求15所述的系统，其特征在于，所述查询服务器，还用于: 若图书基本信息数据中没有相匹配的信息数据时，将所述文字查询信息中包括的图书相关的分词与预先建立的图书类型数据和图书关键词数据中的至少一项进行匹配；若其中一项能够匹配成功，则认为能确定用户所要查询的图书;若任何一项均不能匹配成功，才认为不能确定用户所要查询的图书。17.—种通过语音实现图书查询的装置，其特征在于，包括:获取模块，用于获取用户输入的语音查询信息；转化模块，用于将所述语音查询信息转化为文字查询信息；查询模块，用于将所述文字查询信息与预先建立的图书基本信息数据进行匹配，确定用户所要查询的图书；执行模块，用于若能确定用户所要查询的图书，提示用户进行后续操作;若不能确定用户所要查询的图书，提示用户未查询到图书或提示用户重新输入语音查询信息。18.如权利要求17所述的装置，其特征在于，所述转化模块，具体用于:采用选定的声学模型和语言模型，确定与所述语音查询信息匹配度最高的文字查询信息，得到所述语音查询信息对应的为文字查询信息。19.如权利要求18所述的装置，其特征在于，所述转化模块，具体用于:针对普通图书馆，采用通用的声学模型和语言模型；针对主题图书馆，采用相应主题的声学模型和语言模型。20.如权利要求17所述的装置，其特征在于，所述转化模块，具体用于:采用选定的语言模型，根据待匹配文字中每个分词相对于所有当前已知词的概率，确定待匹配文字的序列本身概率；采用选定的声学模型确定待匹配文字发出语音查询信息这段语音的概率；确定待匹配文字的序列本身概率与待匹配文字发出语音查询信息这段语音的概率的乘积最大的待匹配文字为语音查询信息匹配度最高的文字查询信息。21.如权利要求17所述的装置，其特征在于，所述查询模块，具体用于:将所述文字查询信息中包括的图书相关的分词与预先建立的图书基本信息数据进行匹配;若图书基本信息数据中有相匹配的信息数据，则认为能确定用户所要查询的图书；若图书基本信息数据中没有相匹配的信息数据，则认为不能确定用户所要查询的图书。22.如权利要求21所述的装置，其特征在于，所述查询模块，还用于:若图书基本信息数据中没有相匹配的信息数据时，将所述文字查询信息中包括的图书相关的分词与预先建立的图书类型数据和图书关键词数据中的至少一项进行匹配；若其中一项能够匹配成功，则认为能确定用户所要查询的图书;若任何一项均不能匹配成功，才认为不能确定用户所要查询的图书。23.如权利要求17-22任一所述的装置，其特征在于，所述获取模块，具体用于:获取用户通过本地输入接口输入的语音查询信息;或获取用户通过查询终端输入并通过无线通信网络发送过来的语音查询信息；所述执行模块，具体用于当所述获取模块获取所述查询终端发送的语音查询信息时，若能确定用户所要查询的图书，通知所述查询终端提示用户进行后续操作;若不能确定用户所要查询的图书，通知所述查询终端提示用户未查询到图书或提示用户重新输入语音查询信息。
【文档编号】G06F17/30GK106021531SQ201610355511
【公开日】2016年10月12日
【申请日】2016年5月25日
【发明人】范伟红
【申请人】北京云知声信息技术有限公司

完整全部详细技术资料下载

该技术已申请专利。仅供学习研究，如用于商业用途，请联系技术所有人。
技术研发人员：范伟红;
技术所有人：北京云知声信息技术有限公司;
我是此专利的发明人

上一篇：关键词的显示方法和装置的制造方法
上一篇：一种隐藏应用的方法及装置的制造方法

该领域下的技术专家
如您需求助技术专家，请点此查看客服电话进行咨询。
1、李老师：1.计算力学 2.无损检测
2、毕老师：机构动力学与控制
3、袁老师：1.计算机视觉 2.无线网络及物联网
4、王老师：1.计算机网络安全 2.计算机仿真技术
5、王老师：1.网络安全；物联网安全、大数据安全 2.安全态势感知、舆情分析和控制 3.区块链及应用
如您是高校老师，可以点此联系我们加入专家库。