视听媒体编码系统的利记博彩app

文档序号:7872599阅读:354来源:国知局
专利名称:视听媒体编码系统的利记博彩app
技术领域
本发明涉及一种视听媒体编码系统。优选地,本发明可以适于实时地或延时地对在计算机网络上进行的视频会议、研讨会或者演示进行编码,用于由观察者进行阅览。而且,贯穿于本申请文件的参考是针对用于该情况的本发明而作出的,但是本领域的技术人员应认识,其他应用也是可预见的,并且仅贯穿于本申请文件的上述情况不应被视为限制。
背景技术
视频会议系统已经得到了发展,其允许处于远程位置的参与者之间的双向音频和视频通信。参与者可以通过公共数字传输网络,在摄像机、麦克风和连接到所使用的计算机网络的适当硬件和软件的帮助下,实时地参与视频会议。视频会议通常可用于出现研讨会或者其它类型的演示,其中还可以向另外的输入系统或者文档摄像机提供另外的媒体,诸如幻灯片或者文档,用于集成到所发送的视频或者数据流中。
当视频会议的参与者实时地相互交互时,这带来了对传输视听内容信号的网络带宽的高的要求。而且,如果所使用的网络不具有所需用于正确进行会议的足够的带宽,则可能存在一些关于会议视听内容的质量问题。在该情况中,构成了参与者之间的信号流的互联网协议分组可能丢失或者晚到达接收机,并且因此不能实时地有效地集成到所播出的视频和音频中。
在某些情况中,同样优选的是,向另外的观察者提供或流传送这些视频会议信号,这些观察者不必参与该会议。例如,这些观察者可能关注于所进行的研讨会或者演示,但是不必需要或者不必能够实时地出席或者参与该会议。另外的观察者可以在会议进行时实时地观看视听信号流,或者可替换地,由于他们不需要参参与议,因此可以稍后观看此信息。该视听信号流对于会议的参与者而言,也可以在晚些时候获得。
为了向另外的观察者流传送视频会议内容,生成的信号通常提供给另外的编码计算机系统。使用现有技术,向该计算机提供源自视频会议单元的摄像机和麦克风的视频和音频信号的模拟馈送,其随后将该信息转换、编码或者格式化成为数字计算机文件,其可以由特定的软件播放器应用程序播放。所应用的实际编码或者格式化将取决于播放器应用程序,其随后播放或者显示编码的视频会议。如本领域的技术人员所将理解的,此编码信息可被实时地流传送或者发送到观察者,或者可替换地,可被存储用于稍后发送给观察者。
然而,此用于编码用于另外观察者的视频会议内容的方法受到诸多问题的困扰。
在第一情况中,由于数字音频和视频信息转换为模拟格式,用于随后提供给编码计算机系统,因此在结果格式化输出中存在准确性或者质量的损失。接下来,所使用的计算机系统将这些信号转换回数字格式,导致与所进行的每次转换相关的质量和准确性的损失。
而且,所使用的编码计算机必须配备有至视频会议设备的模拟电缆连接,并且由此在多数情况下还必须位于其中出现了视频会议的一个端点的房间中。这要求额外部分的装置安置在视频会议房间或者场所,除了视频会议设备本身以外,在会议之前还必须对该装置进行设置和配置。
通过使用视频会议传输协议,即ITU H.323,题为“Packet-BasedMulti-Media Communication System(基于分组的多媒体通信系统)”,已经进行了致力于这些问题的一种尝试。该协议允许视听信号和相关的协议信息自所使用的视频会议设备传输到一个网络地址,而该网络地址不用作正在进行的视频会议呼叫的完全参与者。额外的连接可被描述为关于视频会议信号的流端点,该视频会议信号可以提供所需的数字音频和视觉信息,不需要使用现有技术所必需的数字-模拟-数字转换。
然而,关于使用该基本协议的主要复杂性来自于,用于视频会议呼叫的高带宽需求,以及随后的高比特率的至端点的信号流传送。当重新发送到软件播放器应用程序时,所提供输入的较高比特率将出现在所产生的输出中,由此导致了大的视频文件或者高的带宽要求,其不易于通过所使用的计算机网络的低速连接而进行访问。
致力于任何一个或者全部上述问题的改进的视听媒体编码系统将是有利的。能够用作用于会议呼叫端点并且能够以多种比特率编码或者格式化音频和视频会议内容,用于随后流传送到或者提供给观察者的系统将是有利的。能够展现和提供有关如何对这些视频和音频信号进行编码并将其提供给观察者的灵活性和功能的系统将是有利的。
所有参考文献,包括本申请文件中所引用的任何专利或者专利申请,在此处并入列为参考。没有允许任何参考文献构成现有技术。关于参考文献的讨论陈述了它们的作者所声明的内容,并且本申请人保留质询所引用文献的准确性和相关性的权利。应清楚地认识到,尽管此处参考了大量的现有技术出版物,但是这些参考文献不构成允许任何这些文献形成本领域共有的一般性知识的一部分,不论是在新西兰还是在任何其他国家。
应当承认,术语“包括”在变化的管辖权下可被认为具有排他性的或者包含性的意义。为了简化起见,并且除非另有说明,否则术语“包括”将具有包含性的意义,即,其将意味着,不仅包括直接注明的所列成分,还包括其他未说明的成分或者要素。在所使用的术语“被包括的”或“包括的”涉及方法或者处理中的一个或者多个步骤时,也使用相同的解释。
本发明的目的在于解决上述问题,或者至少为公众提供有用的选择。
通过后面仅借助于示例给出的描述,本发明的另外的方面和特征将变得显而易见。

发明内容
根据本发明的一个方面,提供了一种编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,和(iii)对接收视听信号应用选定的编码处理,所述编码处理是取决于所读取的所述至少一个协议信号的内容而选择的。
根据本发明的另一方面,提供了一种编码视听媒体信号的方法,其进一步的特征在于以下额外的后继步骤(i)产生用于软件播放器应用程序的编码输出。
根据本发明的另一方面,提供了一种基本上如上文所述的编码视听媒体信号的方法,其中所述至少一个读取的协议信号的内容是用于检测出现在视频会议传输的视听信号中的至少一个关键帧的时间位置。
根据本发明的另一方面,提供了一种基本上如上文所述的编码视听媒体信号的方法,其中所述至少一个读取的协议信号的内容指出出现在视频会议传输的视听信号中的内容切换。
根据本发明的另一方面,提供了一种基本上如上文所述的编码视听媒体信号的方法,其中使用所述至少一个读取的协议信号检测到内容切换时,选定的编码处理使得至少一个索引标记与编码输出相关联。
根据本发明的另一方面,提供了一种基本上如上文所述的编码方法,其中索引标记同与视频会议传输的视听信号中检测到内容切换的时间位置相同的时间位置处的编码输出相关联。
根据本发明的另一方面,提供了一种基本上如上文所述的编码视听媒体信号的方法,其中所读取的协议信号提供了关于与视频会议传输的视听信号相关联的下列参数的任何组合的信息(i)所使用的音频编解码器和/或(ii)所使用的视频编解码器和/或(iii)所提供的音频信息的比特率和/或(iv)所提供的视频信息的比特率和/或(v)视频信息帧速率和/或(vi)视频信息分辨率。
本发明优选地适于提供一种用于编码视听媒体信号的系统和方法。优选地,这些信号可以源自或提供自视频会议传输,本发明适于将这些信号的至少一部分编码为可以向未直接参与视频会议的其他用户或者观察者播放的格式。而且,贯穿于本申请文件进行参考的是使用计算机网络传输视频会议,但是本领域的技术人员将认识到,显然还可以使用任何形式的数字传输网络基础设施或系统。
优选地,本发明可以用于实现在计算机系统中运行的编码处理,其可以执行如此处描述的编码方法或多种方法。而且,本发明还可以包括用于执行该编码方法的装置,其优选地由装载有适于执行和实现本发明的计算机软件的计算机系统形成。本发明可以适于生成编码输出,其可以被播放、显示或者另外转播给另外的用户,这些新的用户不需要参与所牵涉的视频会议,也不需要在视频会议发生的相同时间观看编码输出。
优选地,结合本发明使用的用于提供所需的编码处理的装置可用于直接参加到所牵涉的视频会议中,并且在某些情况中,可被认为是视频会议端点。用于提供该端点的装置或设备接下来可以对结合视频会议接收的至少一个视听信号执行译码(transcode)或者重新编码(re-encode),用以提供结合本发明的译码视听输出。所生成的编码输出可以存储到计算机文件,或者可替换地,如果需要,其可以在编码后传输或者流传送到其他用户。
优选地,本发明可以适于提供编码输出文件、信号或传输,其可以由基于计算机的软件播放器应用程序接收或播放,以显示视听媒体或内容。在某些情况中,使用本发明提供的编码输出可以在视频会议进行时实时地流传送到或者传输到视频会议的未参与的观察者。可替换地,在其他情况中,所提供的编码输出可以保存到一个或者多个计算机文件,其接下来可以下载到或者传输到未参与的观察者,用于在稍后的时间播放。
例如,在某些情况中,本发明可以适于提供可通过Microsoft的Windows Media PlayerTM、Apple的Quicktime PlayerTM或者Real Network的RealplayerTM播放的编码视听内容输出。而且,所牵涉的播放器还可以支持在所牵涉的视频会议进行时接收至观察者的编码输出的实时流传送。
而且,贯穿于本申请文件进行参考的是,使用基于计算机的软件播放器应用程序在计算机上或由计算机播放本发明提供的编码输出。然而,本领域的技术人员应认识到,贯穿于本申请文件进行参考的计算机应具有最广泛的可能解释,包括任何形式的已编程的或者可编程的逻辑设备。独立的个人计算机、个人数字助理、蜂窝电话、游戏控制台等等也可以全部涵盖于计算的该定义中,并且接下来可以全部配备有适于播放根据本发明提供的编码输出的软件。本领域的技术人员应认识到,所参考的计算机和计算机软件应用程序不应被孤立地认为仅与个人计算机相关。
在本发明的另一优选实施例中,所提供的编码输出可以适于在数字传输网络上传输到或者分布。如果需要,所提供的编码输出的格式化允许使该编码输出容易地和快速地分布到广大的范围和众多的地理分撒的用户。而且,贯穿于本申请文件进行参考的是编码输出的传输是在计算机网络上进行的。但是,本领域的技术人员应认识到,如果需要,可以结合本发明使用允许数字信号或数字内容传输的任何类型传输网络、系统或者基础设施。
而且,贯穿于本申请文件进行参考的是,所提供的编码输出适于提供用于计算机系统的基于软件的播放器应用程序的输入。但是,本领域的技术人员应认识到,结合本发明也可以生成其他格式或形式的编码输出,并且贯穿于本申请文件进行上述参考情况不应被视为限制。例如,在其他实施例中,本发明可以提供能够使用蜂窝电话、PDA、游戏控制台或者其他相似类型设备播放的编码输出。
优选地,所进行的视频会议传输可以使用计算机网络传输。计算机网络在本领域中是公知的,并且可以利用现有的传输协议,诸如TCP/IP,用于向视频会议中的参与者传递信息分组。
在优选实施例中,可以通过如上所述的计算机系统提供结合本发明接收的视频会议传输。结合本发明使用的接收和编码硬件可以连接到该计算机网络,并且可以被分配特定的网络或者IP地址,这些视频会议传输可传递到该地址。
本领域的技术人员应认识到,贯穿于本申请文件进行参考的计算机网络可以涵盖通过专用的以太网电线、无线无线电网络提供的网络以及使用电信系统的分布式网络。
在另一优选实施例中,本发明使用的硬件和装置可被描述为关于所牵涉的视频会议呼叫的流传送端点或者流式端点。流传送端点可以用作视频会议的参与者,而没有必要向视频会议呼叫提供任何有用内容。因此,在计算机网络中具有特定地址的该端点可以接收所有与特定的视频会议相关的传输,且没有必要向会议贡献有用内容。本领域的技术人员应认识到,贯穿于本申请文件进行参考的端点可以涵盖用于实现相同目的任何装置或部件,其先前还被称为,例如,“终端”、“网关”或者“多点控制单元”。
本发明优选地提供了一种用于编码视听媒体的方法以及装置或系统。所使用的系统或装置可以由装载有(并且适于执行)适当的编码软件的计算机系统形成或构成。该软件(通过经由至计算机网络的计算机系统的连接而在计算机系统上执行)可以实现关于本发明所讨论的编码方法。而且,该计算机系统还可以适于存储作为所述方法的编码输出而生成的计算机文件,或者将所提供的编码输出实时地重新发送给另外的观察者。
而且,贯穿于本申请文件进行参考的是,本发明使用或者涵盖连接到计算机网络的编码计算机系统,其适于使用适当的软件接收视频会议传输并对其编码。
例如,在一种情况中,本发明可以利用H323协议用于在计算机网络上进行视频会议传输。该协议可用于直接向编码计算机系统提供数字信号,而不需要信号的任何数字-模拟-数字转换。
贯穿于本申请文件进行参考的是,本发明用于编码源自在计算机网络上进行的视频会议传输的视听媒体。然而,本领域的技术人员应认识到,关于本发明的其他应用也是可预见的,贯穿于本申请文件进行参考的上文的情况不应被视为限制。例如,本发明可用于编码其他形式的流式或者实时视听传输,其不必基于视频会议,也不需要直接涉及在计算机网络上的传输。
优选地,由编码计算机接收的视频会议传输可以包含或包括至少一个或多个视听信号以及至少一个或多个协议信号。
优选地,视听信号在视频会议进行时可以实时地承载关于该视频会议的音频和/或视频内容的信息。在某些情况中,在随时间播出视频会议时,可以提供承载了视频会议的音频和视觉内容的单一的信号。然而,在可替换的情况中,提供了独立的信号用于该所需视频会议的音频和视频分量。
优选地,所接收的视频会议传输还并入或者包括至少一个或者多个协议信号。协议信号可以承载关于视听信号的格式化或构成的信息,包括,与如何生成该信号相关联的参数,以及有关用于生成该信号的物理硬件的配置、状态或者状况的信息。而且,协议信号还可以提供有关何时使用来自用于生成视听信号的特定硬件的反馈或者信息改变和切换内容的指示。此外,协议信号还可以提供有关如何创建所传输的视听信号的信息,诸如例如,在生成信号时是否使用了数据压缩方案,并且还可以提供关于该压缩方案如何操作的某些基本信息。
优选地,本发明可适于在初始时读取结合构成视频会议传输的视听信号接收的至少一个协议信号。然后,可以使用编码到该一个或多个协议信号中的特定信息,做出关于进入的视听信号接下来应如何进行编码和格式化以提供给另外的观察者的特定决定或判定。获取自协议信号的信息可用于选择特定的编码处理或算法,并且随后应用该编码处理或算法,以生成本发明的所需的编码输出。获得自协议信号的信息的确切形式和可用的编码处理以及本发明的操作员的兴趣将确定选择并应用哪个编码处理。
根据本发明的另一方面,提供了一种编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,和(iii)确定出现在所接收视听信号中的关键帧的时间位置,和(iv)将关键帧编码到编码输出中与检测到关键帧的时间位置相同的时间位置处,并且对原始接收的视听信号进行编码。
在优选实施例中,获得自协议信号的信息可以包括或者指出出现在所接收的一个或者多个视听信号中的关键帧的时间位置或方位。
关键帧生成并用于数字视频压缩处理中,并且提供了完整的传统视频信息帧的等效物。除了关键帧以外,还传输作为所牵涉的视频信息的第二部分的像素修改指令。关键帧(其并入了大量的数据)可被获取,并且然后,可以随时间发送关于原始关键帧中目标位置的变化的进一步信息,由此减少了需作为视听信号一部分而被传输的数据量。
然而,由于仅是不定期地传输或并入完整的原始帧(关键帧),因此对视频压缩的近似仍近似于组成原始视频信号的实际帧。如果先前压缩的视频信号随后被重新编码或者“译码”,则这些关键帧可能丢失,或者选择了新的关键帧,其不是初始压缩视频中的原始关键帧。这可能使结果的重新编码或重新格式化的视频信号的质量或者准确性劣化。
然而,如果结合本发明,则可自协议信息提取或检测所使用的每个关键帧的时间位置。这样,这允许随后在视听信号视频内容的重新编码或重新格式化中重新使用相同的关键帧,同时使任何后继的质量损失或者另外失准的引入减到最小。在该情况中,将关键帧编码到编码输出中的同所牵涉的视频会议传输的视听信号中检测到关键帧的时间相同的时间。
根据本发明的另一方面,提供了一种编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,以确定接收视频会议传输的编码特征,和(iii)接收来自至少一个用户的编码优选,和(iv)自编码处理的集合中选择可以使用用户编码优选和编码特征实现的编码处理的子集,和(v)向用户显示该编码处理的子集。
在优选实施例中,本发明还可以向用户提供接口工具,其允许用户或者操作员设置他们如何优选对进入的视听信号的编码或格式化。操作员可以通过该用户接口提供编码优选或者输入信息,该用户接口接下来可用于定制所生成的编码输出的特征。
在另一优选实施例中,可以自一个或者多个协议信号中提取关于进入的视听信号的特征的信息或者参数。接收视频会议传输的这些编码特征可以结合用户提供的信息使用,用以确定特定情况中有待选择的潜在的一个或多个编码方案。
在优选实施例中,接收的编码特征和编码优选可用于自若干潜在的编码处理中选择编码处理的子集,该编码处理的子集可基于接收视频会议传输的编码特征实际地实现,以满足用户的优选。优选地,该可能或者可用处理的子集可以显示给用户,用于随后的一个或者多个用于使用的处理选择。
在另一优选实施例中,本发明可以包括用于预先计算或者预先评估多种编码方案的工具,其将基于用户的编码优选和获得自一个或者多个协议信号的编码特征潜在地生成最优的结果编码输出。在该情况中,可用的或者可能的编码处理的子集仍可以演示或者显示给用户,但是所提供的系统或软件可以为提供关于最优潜在处理的推荐,用于使用户进行选择。
该工具可以类似于用户接口“向导(wizard)”而进行操作,由此将会向用户呈现一种用以仅选择和使用编码方案的工具,其能够满足用户的要求,或者能够满足基于自关于进入视频会议传输的一个或者多个协议信号提取的信息而提供的参数。
例如,在一个优选实施例中,除了所需用于结果输出的软件播放器的格式以外,用户还可以输入关于结果编码输出的所需比特率。用户还可以提供关于来自视频会议呼叫的他们希望模拟的监视器数目的进一步的信息。
这样,由一个或者多个协议信号可以获得关于进入的视听信号的构成或特征的信息。例如,在一种情况中,获得自协议信号的信息该可以包括下列项的任何组合(i)所使用的音频编解码器(ii)所使用的视频编解码器(iii)音频比特率(iv)视频比特率(v)视频帧速率(vi)视频分辨率这样,此可用的关于本发明相关的或者本发明使用的软件的信息可以做出选择,或者向用户呈现选项的范围,该范围指出所将使用的音频和/或视频编解码器,以及可用于使用的特定的视频分辨率和视频帧速率,其将满足原始由用户提供的输入标准。
在优选实施例中,指出视听信号或者接收信号中存在的内容切换的信息可以获得自至少一个协议信号。该内容切换可以指出,视听信号由新的或者不同的硬件部分生成,或者当前使用的摄像机或者麦克风的配置已被修改。
例如,在某些情况中,协议信号可以指出,已经接收到作为视频会议传输一部分的视频冻结画面请求信号。该冻结信号将保持构成所有参与者屏幕上的会议视频内容的当前的帧或画面,并因此将指出发生了内容切换。这样,可以检测到从动态到静态内容的变化。在结合本发明进行内容切换时,还可以检测到协议信号中的冻结画面释放控制命令的传输或者冻结画面请求信号的移除。
而且,通过指出文档摄像机当前是否正用于为会议提供视频馈送的协议信号,也可以检测内容切换。对于会议的参与者,该文档摄像机可以示出印刷材料的良好质量的近距离浏览。这样,文档摄像机的激活或使用、以及文档摄像机信号的集成、或者文档摄像机信号自协议信号中移除接下来可以指出所传输的视频信号内容已被切换或改变。
在另一情况中,协议信号可以承载状态信息,其指出当前将使用数字图像或者数字幻灯片形成会议的视频内容。协议信号中的该图像并入或者静止图像指示信号可再次用于检测内容切换。静止图像或者“抽点”可呈现为会议的视频内容,该图像源自数字文件、数字摄像机、视频记录器、或者任何其他的兼容或者适当类型的数据或信息输入系统。而且,如果需要,由协议信号标记为或者指示为抽点或者静止图像的该内容也可以直接源于具有视频会议设备的文档摄像机。此外,该静止图像信息的移除也可用于指出内容切换。
而且,通过视频摄像机镜头自多个预选观看位置或角度自动地摇动或移动,也可以检测内容切换。可以预先设置这些观看位置,使摄像机的焦点对准选出的座位位置和它们相关联的扬声器,由此,当摄像机预设观看角度变化时,可由存在于协议信号中的信息指出所牵涉的内容切换。因此,将摄像机移动信号集成到协议信号中可用于检测内容切换。
在本发明的另一实施例中,站点名称可以同视频会议的每个端点相关联,其中由每个站点传输的视听信号也具有站点名称,其嵌入在与这些视听传输相关联的一个或者多个协议信号中。通过与一个或者多个视听信号相关联的名称的变化,可以检测内容切换,其中与每个信号相关联的名称可以进一步用于取决于其中生成了内容的每个部分的站点,检索、搜索或者分类所牵涉的内容。
根据本发明的另一方面,提供了一种编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,和(iii)检测所接收视听信号的视听内容中的内容切换,和(iv)在检测到内容切换的时间位置处编码索引标记。
根据本发明的另一方面,提供了一种基本上如上文所述的编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和
(ii)读取一个或者多个协议信号,和(iii)检测所接收视听信号的视听内容中的内容切换,和(iv)编码关键帧,和(v)在与编码关键帧的位置相同或相邻的时间位置处编码索引标记。
根据本发明的另一方面,提供了一种基本上如上文所述的编码方法,其中索引标记被编码在自关键帧的时间位置起的时间阈值内。
在优选实施例中,视听信号中的内容切换的检测或者指示可以触发至少一个索引标记同所提供的编码输出的关联,其中该索引标记基本上同与进入的一个或者多个视听信号中检测到内容切换的时间位置相同的编码输出中的时间位置相关联。
在另一优选实施例中,索引标记可以同与所牵涉的原始进入的一个或者多个视听信号中检测到内容切换的时间位置相同的时间位置相关联。然而,本领域的技术人员应认识到,由于结合本发明使用的软件和设备的物理限制,将出现所牵涉的索引标记的精确安置或定位的一定程度的变化。然而,在可替换的实施例中,所牵涉的索引标记可以同设定的时间阈值周期中的编码输出相关联。在该情况中,关于索引标记何时被编码可以允许一定程度的限度,而所提供的周期的阈值距离或周期限定了该所允许的限度的程度。
而且,已编码索引标记还可以包括关于如何检测特定的内容切换的参考信息,并且因此可以给出关于该索引标记所位于的特定时间位置处的视听信号内容的指示。
在优选实施例中,索引标记可以通过参考、指针、URL或者实际存在于所提供的编码输出中的其他相似标记的实际编码,与所提供的编码输出相关联。这样,在与视频内容的内容切换位置近似相同的位置,由播放器应用程序检测该标记或者参考。然而,在其他的实施例中,索引标记可以不必直接编码到待提供的输出中。例如,在一个实施例中,除了与所牵涉的视频信号相关联的时间位置或方位信息以外,还可以记录索引标记的日志文件或者单独记录。该文件可以指出索引标记与所牵涉的视频内容相关联的特定时间位置。
在另一优选实施例中,通过将通用资源定位符(URL)插入在由本发明生成的编码输出中,可以实现索引标记。本领域的技术人员应认识到,在本领域中URL通常用于索引视听媒体,这样,本发明可以使用现有的技术实现上文讨论的索引标记。
优选地,这些编码到所提供的输出中的索引标记可由播放器应用程序的用户使用,用以取决于这些索引标记所涉及的特定内容,主动搜寻或者搜索本发明的视听输出。索引标记可以标记出编码输出中的选定类型的内容出现的时间位置或方位,并且随后允许用户在所生成的完整输出中搜索选定部分或者选定类型的内容。
在另一优选实施例中,结合本发明,还可以检测在接近对索引标记进行编码的时间位置处、在进入的一个或者多个视听信号中的原始关键帧的存在。
如果有过多的关键帧位置相互接近,则这将使本发明的结果编码输出的质量劣化,并且还将潜在地影响帧速率和质量。然而,优选的是,使关键帧同编码输出中的索引标记接近,这将允许软件播放器应用程序使用附近的关键帧,搜寻该索引标记的时间位置,以快速地生成所需的视频内容。
优选地,通过检测原始关键帧是否接近于对索引标记进行编码的时间位置,本发明可以优化关键帧在结果编码输出中的安置。如果在指定的阈值时间位移容限内不存在关键帧,则在与对索引标记进行编码的时间位置相同的时间位置、或者刚好在其之前、之后接近的时间位置,可以编码新的关键帧。相反地,如果关键帧在阈值时间周期中是可用的,则在结果编码输出中不会生成或者并入新的关键帧。这样,关键帧可以编码到编码输出中与所牵涉的索引标记的时间位置相同或者相邻的时间位置处。
根据本发明的另一方面,提供了一种编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,和(iii)检测所接收视听信号中出现的低内容状态的存在,和(iv)在其中在所接收视频会议传输中检测到所述低内容状态的时间周期期间,对编码输出内容进行时间压缩。
根据本发明的另一方面,提供了一种基本上如上文所述的编码视听媒体信号的方法,其中使用缓冲器接收视频会议传输信号,由此缓冲器内容播出到编码处理中的速率确定了在编码时应用于原始视频会议视听内容的时间压缩程度。
在优选实施例中,本发明还可以用于,在与所提供的一个或者多个原始视听信号进行比较时,修改编码输出中出现的视听内容的特定部分的时序或者时间位置。如果通过读取一个或者多个协议信号检测到特定的内容切换,则可以完成此时序修改。
在另一优选实施例中,当使用至少一个读取的协议信号在接收视听信号中检测到低内容状态时,可以对编码输出进行时间压缩。该低内容状态可能持续随机的时间周期,并且如果其直接编码到编码输出中,则其可能导致僵硬或者缓慢的内容演示。如果需要,(优选地通过在至少一个协议信号中的数据或标志进行的)低内容状态的检测可以允许出现在待加速的编码输出的视听内容中。
在另一优选实施例中,如果在协议信号中检测到快速画面更新或者冻结或保持画面控制指令,则对所接收的视频和音频内容可以进行时间压缩。通常这些指令或者信号与视频会议中的参与者之间的大量的图像信息的传输相关联,其可能需要一定时间以到达特定的端点并且在该特定的端点处进行汇编。接下来,由于在所有该信息已被接收并随后被显示之前,参与者不再关注于当前冻结的图像或画面,因此这可能提供相对僵硬的内容程序。
通过使用本发明,该信息系统可被预高速缓存,并且随后仅显示持续短的时间周期。如果在显示静止图像或者冻结帧的时间中还生成了有限的视频内容,则会议的音频内容也可以随时间进行压缩,以使音频和视觉内容部分同步。
在另一优选实施例中,缓冲器可用于对编码输出的视听内容进行时间压缩。在该实施例中,缓冲器或者类似于缓冲器的部件或者数据结构在初始时可用于接收视听信号,由此,缓冲器的内容播出到编码处理中的速率将接下来确定在编码时应用于视频会议内容的时间压缩程度。当时间压缩在其中检测到低内容状态的选定时间周期中进行时,缓冲器的内容可以以快于正常使用速率的速率播出到进行处理的编码器。
而且,优选地,当在协议信号中接收到冻结画面释放命令或信号时,缓冲器的内容可以以慢于正常速率的速率播出,直至缓冲器弥补了其先前以较快速率播出的内容量。
相比于现有技术,本发明可以提供许多潜在的优点。
本发明可以读取并随后使用来自一个或者多个协议信号的信息,以做出关于如何对视听信号或流进行编码或重新格式化的明智的决定。
自该协议信号可以获得关于进入的视听信号中的原始关键帧安置的信息,接下来使用该信息,用于在所提供的输出视听信息中重新使用相同的关键帧。而且,对于在所提供的编码输出中被检测到或索引的接收视听信号中的特定的内容切换的情况,该技术也是有帮助的。所提供的这些索引标记可以允许用户主动地快速地在结果编码输出搜寻或者搜索特定类型的内容。而且,获得自协议信号的关键帧安置信息还可以用于确保关键帧安置在接近于该索引标记的附近时间位置,由此允许快速地生成并向用户显示所需的视频信息。
获得自一个或者多个协议信号的信息还可用于协助选择用于进入的一个或者多个视听信号的特定的编码方案或型式。基于用户优选或选择并且结合获得自协议信号的关于进入的视听信号的特征,可向用户呈现有限数目的编码方案,其将生成关于所提供的输入信息的最优结果。
本发明还可以提供了一种工具,其用于相对于演示时间,压缩进入的一个或多个视听信号中出现的选定类型的内容。如果在进入的视频会议中检测到相对僵硬的或者缓慢的内容部分(诸如冻结画面分段),则在所提供的编码输出中,出现该内容的时间可被压缩。
附图简述通过下文仅借助于示例给出的描述,并参考附图,本发明的另外的方面将变得显而易见,在附图中

图1示出了结合优选实施例的编码视听媒体的方法中执行的步骤的框式示意性流程图,和图2以示意图的形式说明了参考图1讨论的编码处理所牵涉的信号,和图3a、3b、3c以示意图的形式示出了关于如图2讨论的编码关键帧的信号。
图4示出了根据本发明的另一实施例提供的用户接口和编码方案选择工具。
图5a、5b、5c示出了根据本发明的另一实施例使用和产生的信号的一系列示意图,和图6a、6b和6c再次示意性地示出了根据本发明的另一实施例接收并随后生成的一组信号,和图7和表1示出了结合本发明的优选实施例的关键帧插入或编码中采用的处理流程图和相关的伪代码细化步骤,和图8和9以及表2和3说明了根据本发明的另一实施例的关键帧和索引标记的编码,和图10和表4说明了自适应内容播出机制的提供方案,其在检测到低内容状态时使用缓冲器加速内容编码。
用于实现本发明的最佳模式图1示出了结合优选实施例的编码视听媒体的方法中执行的步骤的框式示意性流程图。
在该方法的第一步骤中,连接到计算机网络的编码计算机系统接收来自该计算机网络的视频会议传输。该视频会议传输包括视听信号和协议信号集。该协议信号除了提供用于生成信号的特定硬件设备的状态以外,还提供关于如何生成视听信号的信息。
在该方法的阶段2中,从在阶段1中接收的协议信号中提取信息。在参考图1和2讨论的实施例中,提取自这些协议信号的信息包括,关键帧被编码到所接收的原始视听信号中时间位置的指示,并且还包括,关于特定的内容切换在所使用的视听信息出现时间的信息。在所考虑的实施例中,通过使用文档摄像机(其相对于示出会议的参与者的摄像机)检测内容切换。
在该方法的阶段3中,基于所读取的协议信号中出现的信息,选择特定的编码处理,用于应用于所接收的视听信号。在所讨论的情况中,选定的编码处理将特定的索引标记参考并入到所提供的输出中,用于指出在使用文档摄像机时出现在视听信息中的内容切换。该选定的编码处理还考虑编码到原始视听信号中的每个关键帧的位置,并且基于所使用的原始关键帧的时间位置,调节所生成的编码输出中的关键帧的生成和应用。
在该方法的步骤4中,生成并产生用于特定的软件播放器应用程序的该方法的编码输出。在参考图1和2讨论的情况中,所提供的编码输出可以在Real Media Real Player上播放。
图2以示意图的形式说明了参考图1讨论的编码处理的要素,示出了原始视听信号(5)以及后继的编码输出的视听信号(6)。
原始信号(5)包括多个沿信号(5)的播放时间的特定时间位置分布的关键帧(7)。原始信号(5)还并入了向参与者显示内容的视频(8)和获取自针对会议参与者训练的视频摄像机的静止图像或者抽点(9)之间的特定的内容切换。
重新编码信号(6)利用获得自协议信号的信息,检测关键帧(7)和内容切换的出现,其中该协议信号接收自进入的视频会议传输。索引标记(10)(在优选实施例中由URL形成)插入到编码输出信号(6)中,用以表示信号的视听内容中的内容切换的出现。
如果有可能,还循环或者重新使用进入的视听信号(5)的原始的关键帧(7),如第二信号(6)中的第一关键帧(11a)的位置所示出的。然而,在所示出的情况中,生成新的关键帧(11b),并且将其编码到第二信号(6)中,用以提供与指出待显示的视听信息中出现内容切换的索引标记接近的关键帧。在该情况中,在第二信号(6)中不重新编码或者重新使用原始信号的第二关键帧(7b)。
图3a~3c示出了进入的视频流(3a)、未使用本发明进行重新编码的视频流(3b)、以及使用本发明进行重新编码的视频流(3c),其中使用了关于原始视频流(3a)的原始关键帧安置的信息。
如可由图3b中可以看到的,在不使用本发明的情况下,译码或者重新编码的视频信号没有必要将关键帧安置于与参考图3a所示的信号中提供的位置相同的位置或者方位。相反地,在图3c中,所使用的关键帧基本上位于与原始的流式视频信号中的原始关键帧相同的时间位置。
图4示出了根据本发明的另一实施例提供的用户接口和编码方案选择装置。
在所示出的情况中,编码计算机系统(12)配备有至计算机网络(14)的连接(13)。该计算机网络(14)可以承载有待提供给编码计算机(12)的视频会议传输,该编码计算机(12)用作关于视频会议的编码端点。编码计算机(12)作为视频会议的参与者,传输所维持的无声音频且空白视频的信号,并且适于提供另外的编码视听输出,其源自视频会议传输中使用的视听信号。
用户接口模块(15)可以提供用于与用于单独用户计算机的编码计算机(12)通信,或者通过在相同的编码计算机(12)上运行的软件进行通信。该用户接口(UI)模块可以在初始时向编码计算机系统发送用户参数信息(16)。编码计算机系统(12)还可以从作为视频会议传输一部分而接收的协议信号中提取视听信号参数信息,其中这些参数给出了关于构成视频传输一部分的视听信号的信息。这些参数可以提供有关进入的视听信号的构成的信息,诸如
(i)所使用的音频编解码器,和(ii)所使用的视频编解码器,和(iii)所提供的音频信息的比特率,和(iv)所提供的视频信息的比特率,和(v)视频信息帧速率,和(vi)视频信息分辨率编码计算机系统可以通过使用所获得的所有用户和协议信息,计算“最相配的”编码方案的数目,该编码方案可用于满足用户关于进入的视频流的需要。然后,关于有效编码方案的信息可以传输(17)到UI模块,其接下来允许用户将方案选择指令(18)传输回到编码计算机(12),用以指出应使用哪个编码方案。
基于这些指令,编码计算机系统可以编码并生成输出(19),其可以在适当的基于计算机的媒体播放器应用程序上播放。
而且,通过下文给出的伪代码,更加详细地示出了用于选择或指定可使用的编码方案的集合的处理。
<pre listing-type="program-listing"><![CDATA[H.323 call parameters   H.263video @ 112kbps   H.263video resolution @ CIF   H.263video frame rate @ 12.5fps   G.728audio @ 16kbpsUser input   Bitrate56kbps Modem   Player formatRealMedia Native-Single Stream   Display modeSingle MonitorProfiler decisions   //find the media type for the stream   //either standard(video and audio only)or presentation(audio,videoand //snapshots)   If Display_Mode=Single_Monitor then  Profiler_Media_Type=(standard)   Else  Profiler_Media_Type=(presentation)   Endlf//find the maximum audio bitrate for the stream based on the mediatype//where media type is standard,allow more bitrate to the audio codecthan if//media type of presentation selected(when presentation need toleave//bandwidth for the snapshot).User_Bitrate=(56kbps)and Profiler_Media_Type=(standard)thereforeMax_Audio_Bitrate=(8.5kbps).//select the audio codec for use in the stream based on the maximum//available bandwidth.If Incoming_Audio_Bitrate>Max_Audio_Bitrate then   Profiler_Audio_Codec=Select Audio_Codec from Table_3 where   Bitrate_Supported<=Max_Audio_Bitrate therefore   Profiler_Audio_Codec=(RealAudio_8.5kbps_Voice)Else   Profiler_Audio_Codec=Incoming_Audio_CodecEndlf//set the video bandwidth based on total available bandwidth andbandwidth//used by audio codec.Profiler_Optimum_Bitrate=Select Optimum_Bitrate from Table_4whereBandwidth_Option=(56kbps_Modem)If(Profiler_Audio_Codec<>Incoming_Audio_Codec)then  Profiler_Audio_Bitrate=Select Bitrate_Supported from Table_3where  Audio_Codec=(Profiler_Audio_Codec)Else  Profiler_Audio_Bitrate=Incoming_Audio_BitrateEndlfProfiler_Video_Bitrate=Profiler_Optimum_Bitrate-Profiler_Audio_BitratethereforeProfiler_Video_Bitrate=(29.5kbps)//set video resolutionProfiler_Video_Res=Select Optimum_Resolution from Table_4where Bandwidth_Option=(56kbps_Modem)thereforeProfiler_Video_Res=(176×144)//set video codecIf User_Player_Format=RealMedia_Native thenProfiler_Video_Codec=(RealVideog).//set video frame rateMax_Profiler_Frame_Rate=Incoming_Frame_RateProfiler_Frame_Rate=Select Optimum_Frame_Rate fromTable_4where Bandwidth_Option=(56kbpsModem)If Profiler_Frame_Rate>Max_Profiler_Frame_Rate then   Profiler_Frame_Rate=Max_Profiler_Frame_RateEndIf]]></pre>
图5a~5c示出了与本发明相关联的信号的一系列示意图,并且说明了取决于其接收信号的本发明的进一步的动作。
图5a示出了进入的协议信号,其指出了在参考图5b示出的视频信号的帧150处出现了抽点事件。图5b还示出了,关键帧在帧125处被编码到原始的进入的视频中。
图5c示出了结合在所示实施例中的本发明提供的编码视频输出。该图说明了,本发明如何取决于输入的接收视频会议传输,将关键帧安置在其编码输出信号中。
本发明使用的软件在所示情况中做出一组决定。通过考虑关于应处于编码输出信号中的关键帧之间的最大时间位移的设定值,完成了这些决定中的第一个。在所示情况中,每150个帧中编码一个关键帧,并且由于关键帧在帧124处提供,因此随后在编码输出(5c)中使用该原始的帧。
其次,所使用的软件指出,索引标记被编码到或者写入到在帧150处提供的输出中,以标出抽点事件在进入的视频信号中的位置。通过考虑关于自该索引标记的时间位移的容限值,所使用的软件可以了解,出现在帧124处的关键帧处于该容限内,并且在帧150处的抽点事件之前不需要对另外的关键帧进行编码。
图6a、6b和6c示出了说明另一实施例中的本发明的进一步的动作的一组信号。在所示实施例中,参考图6a示出了进入的协议信号,参考图6b示出了进入的视频信号,而如图6c,示出了结合本发明提供的编码输出视频。
在该抽点中,进入的视频包括帧275和402处的关键帧,以及帧398处的视频快速更新画面协议信号。相反地,所提供的编码输出包括分别位于帧250和帧402处的关键帧。在示出的该情况中,做出对有待提供的输出进行编码的决定,由此关键帧被安置在隔开150个帧的最大值。然而,关键帧之间的该最大时间可以取决于进入的信号的细节而变化,如下文所讨论的。
当进入信号中的位于帧275处的原始关键帧被检测到时,由所使用的软件做出不对输出中的关键帧进行编码的决定,这是因为其与在帧250处提供的先前的编码关键帧邻近。自帧250起每150个关键帧,应基于关键帧之间的最大时间值对关键帧进行编码。然而,在该情况中,由于帧398处的协议信号示出了预见到关键帧处于随后的帧中,因此未对其进行编码。在该情况中,关键帧之间的最大时间略微扩展,以允许传递与视频快速画面更新相关联的关键帧。该关键帧在帧402处到达进入的视频,并且该关键帧然后在帧402处被编码到输出视频中。
图7和表1示出了结合本发明的优选实施例的关键帧插入或编码中采用的处理流程图和相关的伪代码细化步骤。
所描述的处理在初始时接收来自形成至视频会议呼叫端点的视频会议设备的解码元件或部件的帧。
在初始时审查所接收的帧,以确定其是否是帧内编码的,或者其在结合所牵涉的视频会议而接收的视听信号中形成关键帧。通过检查帧中的实际帧内编码宏块的数目,实现该关键帧测试,其中最大的可能帧内编码宏块计数将指出关键帧的出现。
如果该帧未被确认为关键帧,则该处理进行检查以确定所牵涉的视频会议系统是否已向视频会议传输源传输了快速画面更新,其中该快速画面更新请求关键帧的传输。
如果未预见到关键帧,则测试所接收的帧,以确定其质量或者其包含的宏块要素相比于最大宏块水平的比例或者百分比。在所讨论的实施例中,该阈值测试被设定在85%。如果该帧通过该85%的阈值,则其有效地被当作关键帧进行处理,并且运行涉及关键帧处理的处理部分。
如果接收帧未能通过宏块或者帧内编码测试,则其转发到标准的编码系统,其生成所需的大量编码输出。该编码系统将取决于其内部参数,以帧间编码的形式或者帧内编码的形式,对所需的帧进行编码。
如果接收帧未被确认为关键帧,然而却预见到关键帧,则完成测试,以确定自上一关键帧起的时间是否大于或者等于关键帧之间的可允许的最大时间。如果该测试导致了真值,则所允许的关键帧之间的最大时间增加,并且随后将该帧发送到标准的编码系统。相反地,如果关键帧之间的时间低于所牵涉的最大时间,则简单地将该帧发送到标准的编码系统。
然后,使用关键帧之间的最大时间值测试其是否应将所接收的当前帧编码为关键帧或者编码为帧间编码帧。
如果系统确认接收到了关键帧,或者测试了接收帧的质量并且确定了其具有足够高的质量可被视作关键帧,则检索自接收上一关键帧起的时间。下一步,完成测试以确定当前的关键帧是否是在最大时间阈值之后接收的。如果已经超过了该最大时间阈值,则所提供的该系统或处理将强制将当前帧作为关键帧编码到编码输出中。如果没有超过该最大时间阈值,则将当前帧提供给标准的编码系统。
图8、9以及表2和3说明了根据本发明的另一实施例的关键帧和索引标记的编码。
在参考图8示出的处理的初始阶段,如参考图7所讨论的,采用相同的步骤,用于关键帧的编码。然而,该处理通常在应对关键帧或者帧编码的点处偏离。
在所描述的处理中,将关键帧编码到编码输出被推迟,直至从视频会议接收到所需的关键帧。该处理还测试低的时间阈值,以确定所接收的索引标记是否将被编码到自关键帧起的特定时间周期或者时间位移中。如果在所需的时间周期中没有现存的关键帧是可用的,则将强制将现存的帧作为关键帧而进行编码。相反地,如果关键帧是可用的,则可以使用标准的编码处理。
参考图9和表3讨论的另外的索引状态程序允许监视或跟踪两个并发的或者连续的索引标记事件,并且还允许对所需的任何索引标记进行编码。如果显见的是所牵涉的视频会议中的操作员或者参与者错误地触发了索引标记事件,则允许丢弃这些索引标记中的一个,并且随后或者立即使视频会议设备返回到其先前状态或者现有配置。
图10和表4说明了自适应内容播出机制的提供方案,其在检测到低内容状态时使用缓冲器加速对内容进行的编码。
在所讨论的实现方案中,冻结画面信号和协议信号被用于确定存在低内容状态。由所示处理维持和修改缓冲器数据结构,以取决于所牵涉的视频冻结画面信号是否已被维持或者是否已被释放,加速时基编码速率或者减慢该时基编码速率。
仅借助于示例已描述了本发明的方面,应当理解,在不偏离附属权利要求中限定的本发明的范围的前提下,可以对其进行修改和补充。
权利要求
1.一种编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,和(iii)将所选编码处理应用于所接收的视听信号,所述编码处理是取决于读取的所述至少一个协议信号的内容而选择的。
2.权利要求1的编码方法,其进一步的特征在于以下额外的后继步骤(iv)产生用于软件播放器应用程序的编码输出。
3.权利要求2的编码方法,其中所提供的编码输出适于播放给未直接参与视频会议的用户。
4.权利要求2或3的任何一个的编码方法,其适于提供一个或者多个编码输出文件。
5.权利要求2或3的编码方法,其适于提供编码输出传输。
6.权利要求2~5的任何一个的编码方法,其中所提供的编码输出适于使用计算机系统播放。
7.权利要求2~6的任何一个的编码方法,其中编码输出在计算机网络上分布到用户。
8.权利要求2~7的任何一个的编码方法,其中用于提供编码输出的装置形成了视频会议端点。
9.前面任何一个权利要求的编码方法,其中所读取的协议信号提供了关于与视频会议传输的视听信号相关联的下列参数的任何组合的信息(i)所使用的音频编解码器和/或(ii)所使用的视频编解码器和/或(iii)所提供的音频信息的比特率和/或(iv)所提供的视频信息的比特率和/或(v)视频信息帧速率和/或(vi)视频信息分辨率。
10.前面任何一个权利要求的编码方法,其中所读取的协议信号的内容用于检测视频会议传输的视听信号中出现的至少一个关键帧的时间位置。
11.权利要求10的编码方法,其中关键帧被编码在编码输出中的、与视频会议传输的视听信号中检测到关键帧的时间位置相同的时间位置处。
12.前面任何一个权利要求的编码方法,其中所述至少一个所读取的协议信号的内容指出了在视频会议传输的视听信号中出现的内容切换。
13.权利要求12的编码方法,其中通过提取自协议信号的冻结画面信号来检测内容切换。
14.权利要求12的编码方法,其中通过移除提取自协议信号的冻结画面请求信号来检测内容切换。
15.权利要求12的编码方法,其中通过提取自协议信号的文档摄像机信号来检测内容切换。
16.权利要求12的编码方法,其中通过移除提取自协议信号的文档摄像机信号来检测内容切换。
17.权利要求12的编码方法,其中通过提取自协议信号的图象并入信号来检测内容切换。
18.权利要求12的编码方法,其中通过移除提取自协议信号的图象并入信号来检测内容切换。
19.权利要求12的编码方法,其中通过提取自协议信号的摄像机移动信号来检测内容切换。
20.权利要求12~19的任何一个的编码方法,其中内容切换的检测触发了至少一个索引标记同检测到内容切换的编码输出中对应时间位置处的编码输出之间的关联。
21.权利要求20的编码方法,其中索引标记包括参考信息,其指示所检测到的内容切换。
22.权利要求20或21的任何一个的编码方法,其中协议信号指出了视频会议传输的视听信号中出现的至少一个关键帧的时间位置,并且其中将编码到编码输出中的关键帧安置在与编码到所述输出的索引标记的位置相邻或者相同的位置。
23.权利要求22的编码方法,其中将编码到编码输出中的关键帧安置在自索引标记起的阈值时间内。
24.权利要求22的编码方法,其中关键帧被编码在与索引标记相同的时间位置处。
25.权利要求2~24的任何一个的编码方法,其中当自接收协议信号检测到低内容状态时,对编码输出视听内容进行时间压缩。
26.权利要求25的编码方法,其中缓冲器用于对编码输出的视听内容进行时间压缩。
27.一种编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,和(iii)确定出现在所接收视听信号中的关键帧的时间位置,和(iv)将关键帧编码到编码输出中的、与原始接收视听信号中检测到关键帧的时间位置相同的时间位置处。
28.一种编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,和(iii)检测在所接收的一个或者多个视听信号的视听内容中的内容切换,和(iv)将索引标记编码在检测到内容切换的时间位置处。
29.权利要求28的编码方法,其中索引标记被编码在在自关键帧的时间位置起的时间阈值内。
30.根据本发明的另一方面,提供了一种基本上如上文所述的编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,和(iii)检测所接收视听信号的视听内容中的内容切换,和(iv)编码关键帧,和(v)将索引标记编码在与编码关键帧的时间位置相同或相邻的时间位置处。
31.一种编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,和(iii)检测所接收的一个或者多个视听信号中出现的低内容状态的存在,和(iv)在其中在所接收视频会议传输中检测到所述低内容状态的时间周期期间,对编码输出内容进行时间压缩。
32.权利要求31的编码方法,其中使用缓冲器接收视频会议传输信号,由此缓冲器内容播出到编码处理中的速率确定了在编码时应用于原始视频会议内容的时间压缩程度。
33.一种编码视听媒体信号的方法,其特征在于以下步骤(i)接收来自计算机网络的视频会议传输,所述视频会议传输包括至少一个视听信号和至少一个协议信号,和(ii)读取一个或者多个协议信号,以确定所接收视频会议传输的编码特征,和(iii)接收来自至少一个用户的编码优选,和(iv)自编码处理的集合中选择可以使用该用户优选和该编码特征实现的编码处理的子集,和(v)向用户显示编码处理的子集。
34.一种基本如此处通过参考附图和/或示例描述的并且由该附图和/或示例说明的编码视听信号的方法。
35.一种基本如此处通过参考附图和/或示例描述的并且由该附图和/或示例说明的编码视听信号的方法。
36.适于实现如此处通过参考附图和/或示例描述的并且由该附图和/或示例说明的编码视听信号的方法的计算机软件。
全文摘要
本发明涉及一种用于编码视听媒体信号的方法、系统和装置,该信号优选地源自视频会议传输。所提供的技术适于接收来自计算机网络的视频会议传输,其中该视频会议传输包括至少一个视听信号和至少一个协议信号。然后自接收的传输读取一个或者多个协议信号,所提供的技术将所选的编码处理应用于接收的视听信号,其中所选的该编码处理取决于读取的协议信号的内容。
文档编号H04N7/15GK1714554SQ03824526
公开日2005年12月28日 申请日期2003年8月21日 优先权日2002年8月23日
发明者克雷格·乔治·科克顿 申请人:艾克特斯有限公司
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1