一种中药质量追溯中化学指纹图谱转化为二维码的方法

文档序号:6634743阅读:530来源:国知局
一种中药质量追溯中化学指纹图谱转化为二维码的方法
【专利摘要】本发明公开了一种中药质量追溯中化学指纹图谱转化为二维码的方法,仪器检测后导出的数据文件,统一转换为相同以xls结尾的Excel格式文件;读取数据文件内容,去噪处理,去除各类不需要的数据,对吸光度列取整;寻找所有的特征点集合;对时间列保留小数点1位,以时间列为基准进行数据去重;获取处理后的最终特征点数据集;将最后的数据集转换为二维码。本发明解决了中药化学指纹图谱信息信息量大的难题,通过这种算法,能将中药指纹图谱成功的转换为二维码,弥补了国内外的空白。
【专利说明】一种中药质量追溯中化学指纹图谱转化为二维码的方法

【技术领域】
[0001] 本发明属于中药指纹图谱【技术领域】,具体地说,涉及一种中药质量追溯中化学指 纹图谱转化为二维码的方法。

【背景技术】
[0002] 从中药原材料的生产到成药的销售是一个多环节且复杂的过程,如何确保中药生 产全程质量的"安全、有效、稳定、可控"是疾病预防和治疗成功的关键。目前中药生产和流 通等各环节的质量检测相对独立,质量信息不能相互共享,导致监管盲点的出现。如何进行 中药质量的全程追溯,跟踪中药质量检测信息,已成为目前中药质量追溯的一个亟待解决 的难题。
[0003] 化学指纹图谱是一种综合的,可量化的检定手段,它主要建立在化学成分系统研 究的基础上,用于评价中药材以及中药制剂半成品质量的真实性、优良性和稳定性,是目前 中药质量检测的主要手段。2010年版《中国药典》收载了多种现代分析技术,药典二部中含 量测定或效价测定采用了专属性更强的液相色谱法,它不仅是一种中药质量控制模式和技 术,更发展成为一种采用各种指纹图来进行中药理论(复杂系统)和新药开发的研究体系 和研究模式。但化学指纹图谱在实践应用中,尤其是质量追溯过程中,存在诸多限制:一、化 学指纹图谱为图片格式,数据容量大,信息压缩难度大,难以输出进行批量信息管理;二、化 学指纹图谱不能通过扫描直接获取所包含的质量信息,难以在中药不同生产和流通环节之 间进行信息的共享和管理。
[0004] 条码技术是物流管理现代化的重要技术手段,因其可以快速准确的对流通信息进 行数字化提取并批量管理,近年来在制造业和零售业得到了广泛的推广应用。DNA条码技 术是采用一段标准的DNA序列进行物种鉴定,已经得到了分类专家的广泛认可,在中药真 伪鉴别上应用越来越广泛,并被中国药典收载,作为中药检测手段之一。但DNA分子序列不 能通过直接扫描自动识别,打印输出的尺寸大,不方便把DNA条形码应用于流通管理,一些 学者进而对如何转换DNA序列为二维码进行了相关研究,现已成功应用在中药材真伪鉴定 中。同时,国际上一些专家也提出把指纹图谱转换为二维码应用于身份识别。
[0005] 由于中药化学指纹图谱信息采集量大,远远超过正常的二维码能够承载的容量, 因此中药化学指纹图谱是否能够转换为二维码一直是一个亟待解决的问题。如果化学指 纹图谱可以转化为二维码,则可以通过扫描获得中药质量信息,大大方便了中药质量追溯 的标准化管理。二维码,又称二维条码,是用某种特定的几何图形按一定规律在平面分布 的黑白相间的图形来记录数据符号信息。二维码利用构成计算机内部逻辑基础的 比特流的概念,使用若干个与二进制相对应的几何形体来表示文字数值信息。二维码种类 非常多,分为堆叠式二维码和矩阵式两大类。在目前几十种二维码中,常用的码制有:Data Matrix、Aztec Code、QR Code、Vericode、PDF 417, PDF417Truncated、Codablock F、Code One,除此之外,还有Vericode条码、CP条码、Codablock F条码、田字码、Ultracode条码、 汉信码、Aztec 条码、Code 49、Code 16K 等。
[0006] 由于中药化学指纹图谱的存储数据基本上为数字字符,通过对通用的Data Matrix、Aztec Code、QR Code、Vericode、PDF 417,PDF417 Truncated、Codablock F、Code One进一步分析比较发现,这8种二维码类型中最适合存储数字字符是以下三种:QR Code, Data Matrix和HF 417。表1是这三种二维码的比较情况。从表中我们可以发现:QR Code 无论从数字字符的存储容量、读取速度、读取方向以及遵循的国际标准等各方面的能力都 超过其它二维码编码类型,是最适合用于中药化学指纹图谱数据的存储。这一技术的突破 对建立中药质量的全程追溯和监督具有革命性的创新意义。
[0007] 尽管QR Code最适合用于中药化学指纹图谱的承载,但由于中药化学指纹图谱信 息量大,正常超过200k,所以尽管中药化学指纹图谱和分子序列及指纹图谱具有相似的矢 量特征,但到目前为止尚未有中药化学指纹图谱转换为二维码的研究报道。


【发明内容】

[0008] 为了克服现有技术中存在的缺陷,本发明提出了一种中药质量追溯中化学指纹图 谱转化为二维码的方法,解决了中药化学指纹图谱信息量大难以进行标准化管理的难题, 通过此种算法,能将中药化学指纹图谱成功的转换为二维码,弥补了国内外的空白。其技术 方案如下:
[0009] -种中药质量追溯中化学指纹图谱转化为二维码的方法,包括以下步骤:
[0010] 步骤1.高效液相色谱设备检测后导出的数据文件,如DIF、TXT、CSV等,统一转换 为相同以xls结尾的Excel格式文件;
[0011] 步骤2.读取数据文件内容,去噪处理。去除各类不需要的数据,如时间和吸光度 为负数的数据,对吸光度列取整;
[0012] 步骤3.寻找所有的特征点集合;
[0013] 步骤4.对时间列保留小数点1位,以时间列为基准进行数据去重;
[0014] 步骤5.获取处理后的最终特征点数据集;
[0015] 步骤6.将最后的数据集转换为二维码。
[0016] 进一步优选,步骤3中所述寻找所有的特征点集合具体步骤为:
[0017] 步骤1.读取全部的化学指纹图谱数据转成二维数据ps,初始化用于保存特征点 集合的哈希表hash,设置参数i等于0,二维数组ps总长度为Ien ;
[0018] 步骤2.开始循环读取每一个二维数组ps中的数据,以三个点为基本单位进行比 较,判断当前的数据点是否到了最后一个处理点,如果不是,则继续处理,如果是,则退出; [0019] 步骤3.如果当前数据点是合理的处理点,则判断该点是否符合下面两种情况之
[0020] 1)该点的y值大于前一个点的y值同时也大于等于后一个点y值;
[0021] 2)该点的y值小于前一个点的y值同时也小于等于后一个点y值。
[0022] 如果符合上面的条件则被认为是一个特征点,而被记录到哈希表hash中;
[0023] 步骤4.循环处理,一直到全部的二维数据ps处理完毕;
[0024] 步骤5.得到最终特征点哈希表数据集合。
[0025] 本发明的有益效果为:本发明解决了中药指纹图谱信息信息量大的难题,通过这 种算法,能将中药指纹图谱成功的转换为二维码,弥补了国内外的空白。

【专利附图】

【附图说明】
[0026] 图1为本发明中药指纹图谱转换为可用于质量追溯二维码的方法的流程示意图;
[0027] 图2为本发明寻找所有的特征点集合的算法流程示意图;
[0028] 图3为淫羊藿0303样本;
[0029] 图4为淫羊藿0525样本;
[0030] 图5为肉苁蓉235样本;
[0031] 图6为牡丹皮270样本;
[0032] 图7为淫羊藿0303样本转换成的二维码;
[0033] 图8为淫羊藿0525样本转换成的二维码;
[0034] 图9为肉苁蓉235样本转换成的二维码;
[0035] 图10为牡丹皮270样本转换成的二维码。

【具体实施方式】
[0036] 下面结合附图和【具体实施方式】对本发明的技术方案作进一步详细地说明。
[0037] 本发明方案主要涉及到两个方面,一个是数据处理过程;另外一个是寻找特征点 算法。
[0038] 数据处理过程:首先通过高效液相色谱法获得中药化学指纹图谱数据,一般数据 量非常大,因此需要进行数据的前期处理,参照图1,一种中药质量追溯中化学指纹图谱转 化为二维码的方法,包括以下步骤:
[0039] 步骤1.仪器检测后的导出的数据文件,如DIF、TXT、CSV等,统一转换为相同以xls 结尾的Excel格式文件;
[0040] 步骤2.读取数据文件内容,去噪处理。去除各类不需要的数据,如时间和吸光度 为负数的数据,对吸光度列取整;
[0041] 步骤3.寻找所有的特征点集合;
[0042] 步骤4.对时间列保留小数点1位,以时间列为基准进行数据去重;
[0043] 步骤5.获取处理后的最终特征点数据集;
[0044] 步骤6.将最后的数据集转换为二维码。
[0045] 寻找特征值算法:数据处理过程中关键的处理过程是第3步,寻找中药化学指纹 图谱的特征点集合,计算机的算法说明如图2所示。步骤3中所述寻找所有的特征点集合 具体步骤为:
[0046] 步骤1.读取全部的指纹图谱数据转成二维数据ps,初始化用于保存特征点集合 的哈希表hash,设置参数i等于0,二维数组ps总长度为Ien ;
[0047] 步骤2.开始循环读取每一个二维数组ps中的数据,以三个点为基本单位进行比 较,判断当前的数据点是否到了最后一个处理点,如果不是,则继续处理,如果是,则退出;
[0048] 步骤3.如果当前数据点是合理的处理点,则判断该点是否符合下面两种情况之
[0049] 1)该点的y值大于前一个点的y值同时也大于等于后一个点y值;
[0050] 2)该点的y值小于前一个点的y值同时也小于等于后一个点y值。
[0051] 如果符合上面的条件则被认为是一个特征点,而被记录到哈希表hash中;
[0052] 步骤4.循环处理,一直到全部的二维数据ps处理完毕;
[0053] 步骤5.得到最终特征点哈希表数据集合。
[0054] 通过该算法对中药化学指纹图谱数据集合进行处理,保留了原来中药化学指纹图 谱的关键特征点数据集,大大缩小了数据量,为二维码的生成创造了条件。
[0055] 实施例
[0056] 通过对抽样选取不同类型16个中药化学指纹图谱测试数据进行分析发现,没有 经过筛选的图谱数据文件大约为几百Kb之间,大大超过了现存的二维条码的容量。而经过 我们的数据过程处理后,数据量发生了很大的变化,以下是数据在处理的过程中发生的变 化表,参见表1。
[0057] 表1数据筛选处理过程中数据串长度与点数的变化表
[0058]

【权利要求】
1. 一种中药质量追溯中化学指纹图谱转化为二维码的方法,其特征在于,包括以下步 骤: 步骤1.高效液相色谱设备检测后的导出的数据文件,统一转换为相同以xls结尾的Excel格式文件; 步骤2.读取数据文件内容,去噪处理,去除各类不需要的数据,对吸光度列取整; 步骤3.寻找所有的特征点集合; 步骤4.对时间列保留小数点1位,以时间列为基准进行数据去重; 步骤5.获取处理后的最终特征点数据集; 步骤6.将最后的数据集转换为二维码。
2. 根据权利要求1所述的中药质量追溯中化学指纹图谱转化为二维码的方法,其特征 在于步骤3中所述寻找所有的特征点集合具体步骤为: 步骤1.读取全部的指纹图谱数据转成二维数据ps,初始化用于保存特征点集合的哈 希表hash,设置参数i等于0,二维数组ps总长度为len ; 步骤2.开始循环读取每一个二维数组ps中的数据,以三个点为基本单位进行比较,判 断当前的数据点是否到了最后一个处理点,如果不是,则继续处理,如果是,则退出; 步骤3.如果当前数据点是合理的处理点,则判断该点是否符合下面两种情况之一: 3) 该点的y值大于前一个点的y值同时也大于等于后一个点y值; 4) 该点的y值小于前一个点的y值同时也小于等于后一个点y值; 如果符合上面的条件则被认为是一个特征点,而被记录到哈希表hash中; 步骤4.循环处理,一直到全部的二维数据ps处理完毕; 步骤5.得到最终特征点哈希表数据集合。
【文档编号】G06K19/06GK104376355SQ201410660433
【公开日】2015年2月25日 申请日期:2014年11月19日 优先权日:2014年11月19日
【发明者】李西文, 蔡勇, 胡豪, 陈士林, 倪玉华, 王一涛 申请人:李西文
网友询问留言 已有0条留言
  • 还没有人留言评论。精彩留言会获得点赞!
1