平台介绍


作为“精准医疗”的核心业务,生物医学大数据解读主要包括两个层次:第一层是生物数据的本体注释,如基因测序数据的注释,包括基因的结构、功能、变异、表达水平等;第二层是基因变异与临床结果的关系注释,包括基因与疾病,基因与药物的关系等。第一层次的注释依赖于基因组、转录组、蛋白质组等基础数据库的构建;而第二层的解读依赖于基因-变异-疾病-药物-临床试验等多方面的数据整合,该类数据库内容分散多样、结构与相互关系极其复杂。
慧算利用自身优势,从海量生物医学文献和数据库中进行文本挖掘,通过对多组学数据库的整合与对疾病分子机制和治疗靶点的控制,构建起涵盖基因-变异-疾病-药物-临床意义的生物医学知识体系,形成可全面支持精准医学、基因检测、个体化用药的系统化后台知识库、未来更可用于解释基因变异结果并给出临床诊疗指导方案。


shujufenxi.PNG


慧算同时提供大数据搜索引擎服务、并可帮助医疗、科研单位建设自己的知识库、数据库系统。

image.png



非小细胞肺癌人工智能辅助决策咨询系统


lungcancer.PNG

肿瘤基因突变检测中低丰度突变由于突变核酸含量低,在测序覆盖度较低的情况下极易出现漏检或与假阳性的情况。由于高通量测序中天然存在的噪音,仅从实验角度仍然很难将真实突变和噪音点区分开来,必须通过算法建立降噪和突变检测的模型解决上述问题。慧算通过独家开发的虚拟标签技术,与背景模型结合使用,达到降低整体噪音的目的,提高检测的特异性和敏感性,可以达到准确鉴定低丰度突变。

虚拟分子标签技术通过虚拟标签产生、标签降噪和背景模型降噪等处理过程来完成。由标签产生模块对数据进行标签标记,标记后的数据进入标签降噪模块进行降噪处理,最后进入背景模型中进行进一步的降噪处理,最终输出可信的突变结果。在高深度测序中,往往存在大量的重复序列,重复序列是指在实验过程中由于PCR扩增的步骤产生的与原始序列完全一致的序列,在一般的分析方案中,重复序列会被标记并去除,虚拟标签技术会利用重复序列的信息来去除随机的噪音。通过建立标签策略,消除随机测序错误噪音,获得更高的灵敏度和特异性。虚拟分子标签技术目前已经广泛应用于慧算液体活检NGS检测中,大大提高了检测准确性,为临床提供更为可靠的结果,为患者带来更多获益。

label.png