一种用于数据提取的方法与系统的利记博彩app
【专利摘要】本发明的目的是提供一种用于数据提取的方法与系统。当检测到数据提取触发操作,本发明从当前会话中确定所述数据提取触发操作所对应的数据提取区域;按照目标任务安排,本发明根据所述目标任务安排所包含各数据项目分别对应的特征标记,从所述数据提取区域提取所述各数据项目的项目内容。本发明可以根据目标任务安排,直接从数据提取区域提取目标任务安排所包含各数据项目分别对应的项目内容。这在群会话以及办公场景下是有利的。通过数据项目与特征标记的对应关系,本发明可以自动从用户的会话内容中提取各数据项目的项目内容,从而减少了用户繁琐的手动操作,增强了用户的使用体验。
【专利说明】
一种用于数据提取的方法与系统
技术领域
[0001]本发明涉及信息技术领域,尤其涉及一种用于数据提取的技术。
【背景技术】
[0002]当前的各种即时通信工具所提供的会话功能中,均不包括对会话内容有针对性地提取。例如,用户如果希望提取会话中的特定内容,只能滑动到该会话内容处,进而长按该会话内容,通过弹出的“复制”、“全选”等操作选项来对该会话内容进行相应的处理。
[0003]当应用于群会话场景时,该用户人工手动提取的方式将更难适用。由于此时会话的参与人较多,会话内容更新更快,从而使得用户需要通过更繁琐的手动查找才能定位到其希望操作的会话内容处,进而也只能手动对该会话内容进行各种操作处理。
【发明内容】
[0004]本发明的目的是提供一种用于数据提取的方法与系统。
[0005]根据本发明的一个方面,提供了一种数据提取方法,其中,该方法包括:
[0006]a当检测到数据提取触发操作,从当前会话中确定所述数据提取触发操作所对应的数据提取区域;
[0007]b按照目标任务安排,根据所述目标任务安排所包含各数据项目分别对应的特征标记,从所述数据提取区域提取所述各数据项目的项目内容。
[0008]根据本发明的另一个方面,还提供了一种数据提取系统,其中,该系统包括:
[0009]提取区域确定装置,用于当检测到数据提取触发操作,从当前会话中确定所述数据提取触发操作所对应的数据提取区域;
[0010]数据项目提取装置,用于按照目标任务安排,根据所述目标任务安排所包含各数据项目分别对应的特征标记,从所述数据提取区域提取所述各数据项目的项目内容。
[0011 ]与现有技术相比,本发明可以根据目标任务安排,直接从数据提取区域提取目标任务安排所包含各数据项目分别对应的项目内容。这在群会话以及办公场景下是有利的。通过数据项目与特征标记的对应关系,本发明可以自动从用户的会话内容中提取各数据项目的项目内容,从而减少了用户繁琐的手动操作,增强了用户的使用体验。
【附图说明】
[0012]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本发明的其它特征、目的和优点将会变得更明显:
[0013]图1示出根据本发明一个实施例的用于数据提取的方法流程图;
[0014]图2示出根据本发明另一个优选实施例的用于数据提取的系统示意图。
[0015]附图中相同或相似的附图标记代表相同或相似的部件。
【具体实施方式】
[0016]在更加详细地讨论示例性实施例之前应当提到的是,一些示例性实施例被描述成作为流程图描绘的处理或方法。虽然流程图将各项操作描述成顺序的处理,但是其中的许多操作可以被并行地、并发地或者同时实施。此外,各项操作的顺序可以被重新安排。当其操作完成时所述处理可以被终止,但是还可以具有未包括在附图中的附加步骤。所述处理可以对应于方法、函数、规程、子例程、子程序等等。
[0017]在上下文中所称“计算机设备”,也称为“电脑”,是指可以通过运行预定程序或指令来执行数值计算和/或逻辑计算等预定处理过程的智能电子设备,其可以包括处理器与存储器,由处理器执行在存储器中预存的程序指令来执行预定处理过程,或是由ASIC、 FPGA、DSP等硬件执行预定处理过程,或是由上述二者组合来实现。计算机设备包括但不限于服务器、个人电脑、笔记本电脑、平板电脑、智能手机等。
[0018]所述计算机设备例如包括用户设备与网络设备。其中,所述用户设备包括但不限于智能手机、PDA、PC、笔记本电脑等;所述网络设备包括但不限于单个网络服务器、多个网络服务器组成的服务器组或基于云计算(Cloud Computing)的由大量计算机或网络服务器构成的云,其中,云计算是分布式计算的一种,由一群松散耦合的计算机集组成的一个超级虚拟计算机。其中,所述计算机设备可单独运行来实现本发明,也可接入网络并通过与网络中的其他计算机设备的交互操作来实现本发明。其中,所述计算机设备所处的网络包括但不限于互联网、广域网、城域网、局域网、VPN网络等。
[0019]需要说明的是,所述用户设备、网络设备和网络等仅为举例,其他现有的或今后可能出现的计算机设备或网络如可适用于本发明,也应包含在本发明保护范围以内,并以引用方式包含于此。
[0020]本文后面所讨论的方法(其中一些通过流程图示出)可以通过硬件、软件、固件、中间件、微代码、硬件描述语言或者其任意组合来实施。当用软件、固件、中间件或微代码来实施时,用以实施必要任务的程序代码或代码段可以被存储在机器或计算机可读介质(比如存储介质)中。(一个或多个)处理器可以实施必要的任务。
[0021]这里所公开的具体结构和功能细节仅仅是代表性的,并且是用于描述本发明的示例性实施例的目的。但是本发明可以通过许多替换形式来具体实现,并且不应当被解释成仅仅受限于这里所阐述的实施例。[〇〇22]应当理解的是,虽然在这里可能使用了术语“第一”、“第二”等等来描述各个单元, 但是这些单元不应当受这些术语限制。使用这些术语仅仅是为了将一个单元与另一个单元进行区分。举例来说,在不背离示例性实施例的范围的情况下,第一单元可以被称为第二单元,并且类似地第二单元可以被称为第一单元。这里所使用的术语“和/或”包括其中一个或更多所列出的相关联项目的任意和所有组合。
[0023]这里所使用的术语仅仅是为了描述具体实施例而不意图限制示例性实施例。除非上下文明确地另有所指,否则这里所使用的单数形式“一个”、“一项”还意图包括复数。还应当理解的是,这里所使用的术语“包括”和/或“包含”规定所陈述的特征、整数、步骤、操作、 单元和/或组件的存在,而不排除存在或添加一个或更多其他特征、整数、步骤、操作、单元、 组件和/或其组合。
[0024]还应当提到的是,在一些替换实现方式中,所提到的功能/动作可以按照不同于附图中标示的顺序发生。举例来说,取决于所涉及的功能/动作,相继示出的两幅图实际上可以基本上同时执行或者有时可以按照相反的顺序来执行。
[0025]本发明公开了一种从用户的会话内容中提取数据项目的方案。该数据提取方案可以在用户设备端执行,也可以在网络设备端执行,或可以由用户设备与网络设备配合来执行。
[0026]例如,以在用户设备端进行数据提取来举例,具体地,当检测到数据提取触发操作,用户设备从当前会话中确定所述数据提取触发操作所对应的数据提取区域;随后,按照目标任务安排,用户设备根据所述目标任务安排所包含各数据项目分别对应的特征标记,从所述数据提取区域提取所述各数据项目的项目内容。
[0027]当由网络设备来进行数据提取时,具体步骤与上述在用户设备端进行数据提取的步骤相同,在此不再赘述。当由用户设备与网络设备配合来进行数据提取时,上述确定数据提取区域和提取数据项目的步骤可以分别由用户设备与网络设备来执行,且两者可以任意执行前述两个步骤之一。
[0028]为便于说明,本说明书中以下多以用户设备执行本发明的数据提取方案来进行举例阐述,然而,本领域技术人员应能理解,此种举例仅用于解释说明本发明之目的,而不应被理解为对本发明的任何限制,本发明同样可以由网络设备、或用户设备与网络设备的配合来执行。
[0029]进一步地,本发明适用于用户会话场景,例如各种基于即时通信应用的会话场景。其中,即时通信应用提供一种实时通信系统,通常允许两人或多人使用网络实时的传递文字消息、文件、语音与视频交流。当被应用于群组会话场景时,本发明可以从多个用户的会话内容中提取目标任务安排的数据项目,这在办公场景下是有利的。
[0030]下面结合附图对本发明作进一步详细描述。
[0031]图1示出根据本发明的一个实施例的方法流程图,具体示出一种数据提取过程。
[0032]如图1所示,在步骤SI中,当检测到数据提取触发操作,用户设备从当前会话中确定所述数据提取触发操作所对应的数据提取区域;在步骤S2中,按照目标任务安排,用户设备根据所述目标任务安排所包含各数据项目分别对应的特征标记,从所述数据提取区域提取所述各数据项目的项目内容。
[0033]具体地,在步骤SI中,当检测到数据提取触发操作,用户设备从当前会话中确定数据提取触发操作所对应的数据提取区域。
[0034]在此,数据提取触发操作包括任何可适用于本发明的、可以被设置来触发数据提取的操作,例如各种在屏幕上沿着一定方向的滑动操作,诸如上拉操作、下滑操作、从左至右的滑动操作等,或者各种在屏幕上的点按操作,诸如双击操作、长按操作等。
[0035]此外,数据提取触发操作也可以是各种由按键触发的操作,其中按键可以是物理按键,也可以是虚拟按键。例如,在会话界面中提供一虚拟按键,当用户点击该虚拟按键,即启动本发明的数据提取过程。或者,将音量键设置为触发键,当用户按下所设置的音量键时,即可认为检测到数据提取触发操作。
[0036]当检测到数据提取触发操作时,用户设备可以根据以下方式来确定数据提取区域:
[0037]I)直接将当前屏幕中的会话内容区域作为数据提取区域;
[0038]例如,当检测到数据提取触发操作,如用户在屏幕上施加的上拉操作,用户设备即将当前屏幕区域,也即当前屏幕中所呈现的会话内容区域,作为数据提取触发操作所对应的数据提取区域。
[0039]2)将预定时间段内发生的会话内容区域作为数据提取区域;
[0040]在此,进行数据提取的时间段可以是预先设置的,如之前几小时内或今日等,取决于具体应用需求。例如,预定时间段被设置为今日,则当检测到数据提取触发操作,用户设备即将今日发生的会话内容所在的区域作为数据提取触发操作所对应的数据提取区域。
[0041]3)根据用户指定来确定数据提取区域。
[0042]在检测到数据提取触发操作之后,用户设备还可以进一步接收用户对数据提取区域的指定,也即由用户来设定数据提取区域的起点和终点。例如,当检测到数据提取触发操作,用户设备向用户提示需进一步选择起点和终点,从而用户通过滑动屏幕来从会话内容区域中选定数据提取区域的起点和终点。
[0043]进一步地,数据提取触发操作还可以为一操作组合,操作组合包括至少两个操作, 以分别用于确定数据提取区域的起点和终点。
[0044]例如,用户首先当前会话内容区域的一侧长按屏幕,随后向下滑动该会话内容区域并在停止滑动后,再次长按屏幕,用户设备即将用户两次长按屏幕时所对应的会话内容区域处分别作为数据提取区域的起点和终点。可替代地,用户在首先长按屏幕后,随后在屏幕上滑动,用户设备可以将用户滑动操作的停止处作为数据提取区域的终点。[〇〇45]本领域技术人员应能理解,上述各项数据提取触发操作以及相应的数据提取区域的确定方式均为示例,仅用于解释说明本发明之目的,而不应被视为对本发明的任何限制, 其他任何现有的或将来的数据提取触发操作以及相应的数据提取区域的确定方式如可适用于本发明,均应被包含在本发明的专利保护范围,并被引用于此。
[0046]在步骤S2中,按照目标任务安排,用户设备根据所述目标任务安排所包含各数据项目分别对应的特征标记,从所述数据提取区域提取所述各数据项目的项目内容。
[0047]其中,目标任务安排包括任何可以由本发明的数据提取方案来实现的任务安排, 其可以包括多个数据项目,每个数据项目具有指定的数据格式/内容,这些数据项目可以从用户的会话内容中提取。例如,目标任务安排具体包括但不限于日程安排、项目汇报、报销审批等。这些目标任务安排均各自具有特定的数据项目。具体地,例如,日程安排可以包括诸如时间、地点、事项、参与人等数据项目,项目汇报可以包括诸如项目名称、负责人、进度、 报告时间等数据项目,报销审批可以包括诸如事项、时间、费用、
【申请人】、审批人等数据项目。
[0048]在此,目标任务安排可以是预定的,也可以是在检测到数据提取触发操作后实时确定的。
[0049]例如,对于预定目标任务安排的场景,会话组是基于目标任务安排来建立的,此时当前会话组仅用于讨论与目标任务安排相关的内容,或者仅能从当前会话组中提取与目标任务安排相关的内容。进一步地,当前会话组的名称或属性即可设置为相应的目标任务安排,例如报销群、XX项目群。
[0050]例如,对于实时确定目标任务安排的场景,目标任务安排可以与数据提取触发操作相关联,从而不同的数据提取触发操作可以对应不同的目标任务安排。具体地,例如,在屏幕上由下至上的上拉操作可以关联项目汇报,由左至右的滑动操作可以关联报销审批。优选地,前述不同的数据提取触发操作可以对应不同的目标任务安排,并可以被用于同一会话组。
[0051 ]在此,各数据项目的特征标记库可以是预先建立的。
[0052]数据项目的特征标记库可以是一个独立的库,例如包括任何任务安排的数据项目的标记。或者,数据项目的特征标记库也可以是每个任务安排所特定的,也即,一个任务安排对应有一个其所包括数据项目的特征标记库。
[0053]其中,上述特征标记库可以是由网络设备建立的,也可以是用户设备建立的。
[0054]例如,网络设备预先建立一个数据项目的特征标记库,其中包括所有任务安排所对应的数据项目的特征标记,具体如:数据项目“人名”的特征标记为@、数据项目“主题”的特征标记为#、数据项目“金额”的特征标记为Y、数据项目“发邮件”的特征标记为mailto等。
[0055]例如,用户设备在本地建立一个关于任务安排“项目汇报”的各数据项目的特征标记库,其中包括如:数据项目“项目名称”的特征标记为“task”、数据项目“负责人”的特征标记为“head”、数据项目“进度”的特征标记为“progress”、数据项目“报告时间”的特征标记为 “time” 等。
[0056]需要说明的是,上述对各特征标记的举例仅为解释说明本发明之目的,而不应被理解为对本发明的任何限制。如果其他现有的或将来的各种特征标记的表示方式被同样用于表达本发明中所定义的数据项目,则同样属于本发明所指示的数据项目的特征标记,故应被包含在本发明的专利保护范围之内,并可以引用方式包含于此。
[0057]对于预先建立的特征标记库,用户设备可以查询该特征标记库来确定目标任务安排的各数据项目所分别对应的特征标记,进而从数据提取区域提取对应的各具体项目内容。
[0058]例如,目标任务安排为“项目汇报”,用户设备根据其数据项目“项目名称”的特征标记“task”、数据项目“负责人”的特征标记“head”、数据项目“进度”的特征标记“progress”以及数据项目“报告时间”的特征标记“time”从所确定的数据提取区域中分别提取相应的具体项目内容,如数据提取区域为今日的会话内容,则用户设备根据特征标记“task”提取从中数据项目“项目名称”的项目内容为note3bUg,根据特征标记“head”从中提取数据项目“负责人”的项目内容为张XX,根据特征标记“progress”从中提取数据项目“进度”的项目内容为最终测试,根据特征标记“time”从中提取数据项目“报告时间”的项目内容为 2015/xx/xx。
[0059]优选地,各数据项目与特征标记的对应关系可以至少通过以下3种来设置:
[0060]I)统计多个用户的会话内容,以确定各数据项目与特征标记的对应关系。
[0061]具体地,统计大量用户的会话内容,并通过机器学习的方式不断从中确定数据项目与特征标记的对应关系。例如,大量用户会在@之后输入人名,据此可以确定特征标记@对应于数据项目“参与人”。
[0062]2)接收至少一个用户上传的各数据项目与特征标记的对应关系。
[0063]具体地,每个用户可以自行设置数据项目与特征标记的对应关系,从而用户设备,甚至网络设备,可以据此获得每个用户设置的各数据项目与特征标记的对应关系,以后续用于对相应用户的项目内容提取。
[0064]优选地,在获取多个用户上传的其各自所设置的数据项目与特征标记的对应关系之后,可以对这些对应关系进行汇总/筛选等处理,从而获得最终的数据项目与特征标记的一一对应关系,并将该一一对应关系返回给各用户,以使得所有用户可以采用统一的表述方式进行会话输入。基于此种统一的数据项目与特征标记的对应关系,在进行数据项目的项目内容提取时是有利且高效的,并且用户之间也可采用相同的规则来进行交流。
[0065]3)根据当前会话中各参与用户的语言习惯,确定各数据项目与特征标记的对应关系O
[0066]具体地,从各用户的语言习惯的角度进行考虑来确定其各自所偏好的数据项目与特征标记的对应关系,这更方便用户的输入以及新用户的使用体验。例如,有些用户习惯用“时间”来表述数据项目“时间”,有些用户习惯用“time”来表述数据项目“时间”,则可以针对具体用户来按照其各自语言习惯将数据项目“时间”的特征标识对应于“时间”或“time”。
[0067]需要说明的是,本领域技术人员应能理解,上述3)种设置方式并非相互排斥,而是可以相互结合来用于确定各数据项目与特征标记的对应关系。并且,上述3)种设置方式可以在用户设备端实现,也可以在网络设备端实现。当然,当需要对多个用户的设置或语言习惯等进行处理时,由网络设备端进行最终的数据项目与特征标记的对应关系的确定更为有利和尚效。
[0068]优选地,在用户设备提取目标任务安排的各数据项目的项目内容之后,用户还可以对各项目内容进行编辑,以补充/修正所提取的项目内容。进一步地,用户设备还可以将相关项目内容所属的会话内容处截图作为目标任务安排的补充内容,并呈现给用户。
[0069]图2示出根据本发明的一个实施例的系统示意图,具体示出一种数据提取的系统。如图2所示,数据提取系统包括提取区域确定装置21和数据项目提取装置22。
[0070]需要说明的是,提取区域确定装置21和数据项目提取装置22可以均被布置于用户设备中,也即数据提取系统被布置于用户设备中;或者,提取区域确定装置21和数据项目提取装置22被分别布置于用户设备和网络设备中,从而两者共同组成数据提取系统;或者,提取区域确定装置21和数据项目提取装置22可以均被布置于网络设备中,也即数据提取系统被布置于网络设备中。
[0071]为便于说明,以下以数据提取系统被布置于用户设备中进行描述,本领域技术人员应能理解此种描述仅用于解释说明本发明之目的,而不应被理解为对本发明的任何限制。
[0072]具体地,当检测到数据提取触发操作,提取区域确定装置21从当前会话中确定所述数据提取触发操作所对应的数据提取区域;随后,按照目标任务安排,数据项目提取装置22根据所述目标任务安排所包含各数据项目分别对应的特征标记,从所述数据提取区域提取所述各数据项目的项目内容。
[0073]其中,当检测到数据提取触发操作,提取区域确定装置21从当前会话中确定数据提取触发操作所对应的数据提取区域。
[0074]在此,数据提取触发操作包括任何可适用于本发明的、可以被设置来触发数据提取的操作,例如各种在屏幕上沿着一定方向的滑动操作,诸如上拉操作、下滑操作、从左至右的滑动操作等,或者各种在屏幕上的点按操作,诸如双击操作、长按操作等。
[0075]此外,数据提取触发操作也可以是各种由按键触发的操作,其中按键可以是物理按键,也可以是虚拟按键。例如,在会话界面中提供一虚拟按键,当用户点击该虚拟按键,BP 启动本发明的数据提取过程。或者,将音量键设置为触发键,当用户按下所设置的音量键时,即可认为检测到数据提取触发操作。
[0076]当检测到数据提取触发操作时,提取区域确定装置21可以根据以下方式来确定数据提取区域:
[0077]1)直接将当前屏幕中的会话内容区域作为数据提取区域;
[0078]例如,当检测到数据提取触发操作,如用户在屏幕上施加的上拉操作,提取区域确定装置21即将当前屏幕区域,也即当前屏幕中所呈现的会话内容区域,作为数据提取触发操作所对应的数据提取区域。
[0079]2)将预定时间段内发生的会话内容区域作为数据提取区域;
[0080]在此,进行数据提取的时间段可以是预先设置的,如之前几小时内或今日等,取决于具体应用需求。例如,预定时间段被设置为今日,则当检测到数据提取触发操作,提取区域确定装置21即将今日发生的会话内容所在的区域作为数据提取触发操作所对应的数据提取区域。[0081 ]3)根据用户指定来确定数据提取区域。
[0082]在检测到数据提取触发操作之后,提取区域确定装置21还可以进一步接收用户对数据提取区域的指定,也即由用户来设定数据提取区域的起点和终点。例如,当检测到数据提取触发操作,提取区域确定装置21向用户提示需进一步选择起点和终点,从而用户通过滑动屏幕来从会话内容区域中选定数据提取区域的起点和终点。[〇〇83]进一步地,数据提取触发操作还可以为一操作组合,操作组合包括至少两个操作, 以分别用于确定数据提取区域的起点和终点。
[0084]例如,用户首先当前会话内容区域的一侧长按屏幕,随后向下滑动该会话内容区域并在停止滑动后,再次长按屏幕,提取区域确定装置21即将用户两次长按屏幕时所对应的会话内容区域处分别作为数据提取区域的起点和终点。可替代地,用户在首先长按屏幕后,随后在屏幕上滑动,提取区域确定装置21可以将用户滑动操作的停止处作为数据提取区域的终点。
[0085]需要说明的是,当提取区域确定装置21被布置于网络设备中时,对于用户在用户设备侧的各种操作,如对屏幕的长按等操作,可以由用户设备检测并通知提取区域确定装置21,提取区域确定装置21进而可以根据各种预定规则确定相应的数据提取区域。进一步地,用户设备还可以发送其他操作相关数据,诸如检测到屏幕长按操作时当前屏幕中会话内容区域的起点和终点、屏幕长按操作所对应的会话内容位置等。
[0086]本领域技术人员应能理解,上述各项数据提取触发操作以及相应的数据提取区域的确定方式均为示例,仅用于解释说明本发明之目的,而不应被视为对本发明的任何限制, 其他任何现有的或将来的数据提取触发操作以及相应的数据提取区域的确定方式如可适用于本发明,均应被包含在本发明的专利保护范围,并被引用于此。
[0087]按照目标任务安排,数据项目提取装置22根据所述目标任务安排所包含各数据项目分别对应的特征标记,从所述数据提取区域提取所述各数据项目的项目内容。
[0088]其中,目标任务安排包括任何可以由本发明的数据提取方案来实现的任务安排, 其可以包括多个数据项目,每个数据项目具有指定的数据格式/内容,这些数据项目可以从用户的会话内容中提取。例如,目标任务安排具体包括但不限于日程安排、项目汇报、报销审批等。这些目标任务安排均各自具有特定的数据项目。具体地,例如,日程安排可以包括诸如时间、地点、事项、参与人等数据项目,项目汇报可以包括诸如项目名称、负责人、进度、报告时间等数据项目,报销审批可以包括诸如事项、时间、费用、
【申请人】、审批人等数据项目。
[0089]在此,目标任务安排可以是预定的,也可以是在检测到数据提取触发操作后实时确定的。
[0090]例如,对于预定目标任务安排的场景,会话组是基于目标任务安排来建立的,此时当前会话组仅用于讨论与目标任务安排相关的内容,或者仅能从当前会话组中提取与目标任务安排相关的内容。进一步地,当前会话组的名称或属性即可设置为相应的目标任务安排,例如报销群、XX项目群。
[0091 ]例如,对于实时确定目标任务安排的场景,目标任务安排可以与数据提取触发操作相关联,从而不同的数据提取触发操作可以对应不同的目标任务安排。具体地,例如,在屏幕上由下至上的上拉操作可以关联项目汇报,由左至右的滑动操作可以关联报销审批。优选地,前述不同的数据提取触发操作可以对应不同的目标任务安排,并可以被用于同一会话组。
[0092]在此,目标任务安排的确定可以由一专门的装置(图2未示出)来执行。例如,数据提取系统还可包括一任务安排确定装置,该装置用于确定目标任务安排。优选地,该装置也可以与数据项目提取装置22集成在一起。
[0093]在此,各数据项目的特征标记库可以是预先建立的。
[0094]数据项目的特征标记库可以是一个独立的库,例如包括任何任务安排的数据项目的标记。或者,数据项目的特征标记库也可以是每个任务安排所特定的,也即,一个任务安排对应有一个其所包括数据项目的特征标记库。
[0095]其中,上述特征标记库可以是由网络设备建立的,也可以是用户设备建立的。
[0096]例如,网络设备预先建立一个数据项目的特征标记库,其中包括所有任务安排所对应的数据项目的特征标记,具体如:数据项目“人名”的特征标记为@、数据项目“主题”的特征标记为#、数据项目“金额”的特征标记为Y、数据项目“发邮件”的特征标记为mailto等。
[0097]例如,用户设备在本地建立一个关于任务安排“项目汇报”的各数据项目的特征标记库,其中包括如:数据项目“项目名称”的特征标记为“task”、数据项目“负责人”的特征标记为“head”、数据项目“进度”的特征标记为“progress”、数据项目“报告时间”的特征标记为 “time” 等。
[0098]需要说明的是,上述对各特征标记的举例仅为解释说明本发明之目的,而不应被理解为对本发明的任何限制。如果其他现有的或将来的各种特征标记的表示方式被同样用于表达本发明中所定义的数据项目,则同样属于本发明所指示的数据项目的特征标记,故应被包含在本发明的专利保护范围之内,并可以引用方式包含于此。
[0099]对于预先建立的特征标记库,用户设备可以查询该特征标记库来确定目标任务安排的各数据项目所分别对应的特征标记,进而从数据提取区域提取对应的各具体项目内容。
[0100]例如,目标任务安排为“项目汇报”,用户设备根据其数据项目“项目名称”的特征标记“task”、数据项目“负责人”的特征标记“head”、数据项目“进度”的特征标记 “progress”以及数据项目“报告时间”的特征标记“time”从所确定的数据提取区域中分别提取相应的具体项目内容,如数据提取区域为今日的会话内容,则用户设备根据特征标记 “task”提取从中数据项目“项目名称”的项目内容为note3bug,根据特征标记“head”从中提取数据项目“负责人”的项目内容为张XX,根据特征标记“progress”从中提取数据项目“进度”的项目内容为最终测试,根据特征标记“time”从中提取数据项目“报告时间”的项目内容为 2015/xx/xx。
[0101]优选地,数据提取系统还可以包括一特征标记设置装置(图2未示出),特征标记设置装置至少可以通过以下3种来设置各数据项目与特征标记的对应关系:
[0102]1)统计多个用户的会话内容,以确定各数据项目与特征标记的对应关系。
[0103]具体地,特征标记设置装置统计大量用户的会话内容,并通过机器学习的方式不断从中确定数据项目与特征标记的对应关系。例如,大量用户会在@之后输入人名,据此可以确定特征标记@对应于数据项目“参与人”。
[0104]2)接收至少一个用户上传的各数据项目与特征标记的对应关系。
[0105]具体地,每个用户可以自行设置数据项目与特征标记的对应关系,从而特征标记设置装置可以据此获得每个用户设置的各数据项目与特征标记的对应关系,以后续用于对相应用户的项目内容提取。[〇1〇6]优选地,在获取多个用户上传的其各自所设置的数据项目与特征标记的对应关系之后,特征标记设置装置可以对这些对应关系进行汇总/筛选等处理,从而获得最终的数据项目与特征标记的一一对应关系,并将该一一对应关系返回给各用户,以使得所有用户可以采用统一的表述方式进行会话输入。基于此种统一的数据项目与特征标记的对应关系, 在进行数据项目的项目内容提取时是有利且高效的,并且用户之间也可采用相同的规则来进行交流。
[0107]3)根据当前会话中各参与用户的语言习惯,确定各数据项目与特征标记的对应关系。
[0108]具体地,从各用户的语言习惯的角度进行考虑来确定其各自所偏好的数据项目与特征标记的对应关系,这更方便用户的输入以及新用户的使用体验。例如,有些用户习惯用 “时间”来表述数据项目“时间”,有些用户习惯用“time”来表述数据项目“时间”,则可以针对具体用户来按照其各自语言习惯将数据项目“时间”的特征标识对应于“时间”或“time”。 [〇1〇9]需要说明的是,本领域技术人员应能理解,上述3)种设置方式并非相互排斥,而是可以相互结合来用于确定各数据项目与特征标记的对应关系。并且,上述3)种设置方式可以在用户设备端实现,也可以在网络设备端实现。当然,当需要对多个用户的设置或语言习惯等进行处理时,由网络设备端进行最终的数据项目与特征标记的对应关系的确定更为有利和尚效。
[0110]优选地,在数据提取系统提取目标任务安排的各数据项目的项目内容之后,用户还可以对各项目内容进行编辑,以补充/修正所提取的项目内容。进一步地,数据提取系统还可以将相关项目内容所属的会话内容处截图作为目标任务安排的补充内容,并呈现给用户。
[0111]需要注意的是,本发明可在软件和/或软件与硬件的组合体中被实施,例如,可采用专用集成电路(ASIC)、通用目的计算机或任何其他类似硬件设备来实现。在一个实施例中,本发明的软件程序可以通过处理器执行以实现上文所述步骤或功能。同样地,本发明的软件程序(包括相关的数据结构)可以被存储到计算机可读记录介质中,例如,RAM存储器,磁或光驱动器或软磁盘及类似设备。另外,本发明的一些步骤或功能可采用硬件来实现,例如,作为与处理器配合从而执行各个步骤或功能的电路。
[0112]另外,本发明的一部分可被应用为计算机程序产品,例如计算机程序指令,当其被计算机执行时,通过该计算机的操作,可以调用或提供根据本发明的方法和/或技术方案。而调用本发明的方法的程序指令,可能被存储在固定的或可移动的记录介质中,和/或通过广播或其他信号承载媒体中的数据流而被传输,和/或被存储在根据所述程序指令运行的计算机设备的工作存储器中。在此,根据本发明的一个实施例包括一个装置,该装置包括用于存储计算机程序指令的存储器和用于执行程序指令的处理器,其中,当该计算机程序指令被该处理器执行时,触发该装置运行基于前述根据本发明的多个实施例的方法和/或技术方案。
[0113]对于本领域技术人员而言,显然本发明不限于上述示范性实施例的细节,而且在不背离本发明的精神或基本特征的情况下,能够以其他的具体形式实现本发明。因此,无论从哪一点来看,均应将实施例看作是示范性的,而且是非限制性的,本发明的范围由所附权利要求而不是上述说明限定,因此旨在将落在权利要求的等同要件的含义和范围内的所有变化涵括在本发明内。不应将权利要求中的任何附图标记视为限制所涉及的权利要求。此夕卜,显然“包括”一词不排除其他单元或步骤,单数不排除复数。系统权利要求中陈述的多个单元或装置也可以由一个单元或装置通过软件或者硬件来实现。第一,第二等词语用来表示名称,而并不表示任何特定的顺序。
【主权项】
1.一种数据提取方法,其中,该方法包括:a当检测到数据提取触发操作,从当前会话中确定所述数据提取触发操作所对应的数 据提取区域;b按照目标任务安排,根据所述目标任务安排所包含各数据项目分别对应的特征标记, 从所述数据提取区域提取所述各数据项目的项目内容。2.根据权利要求1所述的方法,其中,该方法还包括:_设置各数据项目与特征标记的对应关系。3.根据权利要求2所述的方法,其中,该方法还包括:-统计多个用户的会话内容,以确定各数据项目与特征标记的对应关系。4.根据权利要求2或3所述的方法,其中,该方法还包括:_接收至少一个用户上传的各数据项目与特征标记的对应关系。5.根据权利要求2至4中任一项所述的方法,其中,该方法还包括:-根据所述当前会话中各参与用户的语言习惯,确定各数据项目与特征标记的对应关 系。6.根据权利要求1至5中任一项所述的方法,其中,该方法还包括:-确定所述目标任务安排。7.根据权利要求6所述的方法,其中,所述目标任务安排与所述数据提取触发操作相关联。8.根据权利要求1至7中任一项所述的方法,其中,所述数据提取触发操作为一操作组 合,所述操作组合包括至少两个操作,以分别用于确定所述数据提取区域的起点和终点。9.根据权利要求1至8中任一项所述的方法,其中,所述目标任务安排包括以下任一项: -日程安排;-项目汇报;-报销审批。10.—种数据提取系统,其中,该系统包括:提取区域确定装置,用于当检测到数据提取触发操作,从当前会话中确定所述数据提 取触发操作所对应的数据提取区域;数据项目提取装置,用于按照目标任务安排,根据所述目标任务安排所包含各数据项 目分别对应的特征标记,从所述数据提取区域提取所述各数据项目的项目内容。11.根据权利要求10所述的系统,其中,该系统还包括:特征标记设置装置,用于设置各数据项目与特征标记的对应关系。12.根据权利要求11所述的系统,其中,所述特征标记设置装置进一步用于:-统计多个用户的会话内容,以确定各数据项目与特征标记的对应关系。13.根据权利要求11或12所述的系统,其中,所述特征标记设置装置进一步用于:-接收至少一个用户上传的各数据项目与特征标记的对应关系。14.根据权利要求11至13中任一项所述的系统,其中,所述特征标记设置装置进一步用 于:-根据所述当前会话中各参与用户的语言习惯,确定各数据项目与特征标记的对应关 系。15.根据权利要求10至14中任一项所述的系统,其中,该系统还包括: 任务安排确定装置,用于确定所述目标任务安排。16.根据权利要求15所述的系统,其中,所述目标任务安排与所述数据提取触发操作相关联。17.根据权利要求10至16中任一项所述的系统,其中,所述数据提取触发操作为一操作组合,所述操作组合包括至少两个操作,以分别用于确定所述数据提取区域的起点和终点。18.根据权利要求10至17中任一项所述的系统,其中,所述目标任务安排包括以下任一项: -日程安排; -项目汇报; -报销审批。
【文档编号】G06F3/0483GK106033298SQ201610287295
【公开日】2016年10月19日
【申请日】2016年5月3日
【发明人】胡嵩
【申请人】海致网络技术(北京)有限公司