干货篇:AI赋能医药工业发展案例
刚刚过去的这个周末,我受到邀请进行了一次演讲,演讲题目是《AI赋能医药工业发展案例》。
这次演讲中,我将我们之前所做过的2个案例给大家做了详细的讲解,出乎意料的是对医药方面感兴趣的听众远远高于我的预期。
从产业互联网的角度来考虑,未来是B端产品的市场,也是传统企业转型信息化的重要时刻。我们需要结合未来的发展对以后的产品布局进行深入的分析,做好顶层架构,才能拥抱以后的产品格局的变化。
我是医药行业的产品经理,所以在这次演讲中主要针对于医药工业方向进行了主要论述。其中包含医药工业语言的定义及符号OCR技术,知识图谱在医药工业以及药物情报领域的应用等。
对于医药工业还有很多工作可以去做,在我的演讲中也进行了梳理,从早期药物发现、上游工艺、下游工艺、生产质控等多个方面,还有待于我们去探索。
我在这里给大家详解一下我演讲的主要内容。
头像和介绍就不细说了,目前为止没有出现脱发的相关症状。
工业互联网的核心在于数据采集、数据连接、数据计算与处理,俗称端、管、云三大基石。其中“端”主要讲的是设备互联,“管”主要讲的是内外互联,“云”主要强调的是云计算、边缘计算等内容。
对于药物研发,很多人会认为药物研发高深莫测,其实这些的确离大众比较远。产业互联网的兴起就是脱离的大众的认知,将技术带入到产业之中。
本次的主题是医药工业研发案例,那自然会有很多医药行业的知识在其中。具体AI如何能够对医药工业的环境进行加速,手下我们必须了解都能在哪些地方加速。下图中详细的描述了各个应用场景中的一些内容。
对于没有医药背景的伙伴,可能理解上稍微困难一些,不过可以体会如何分解具体的工业环节。
首先,我们通过工业语言的案例进行讲解。
工业语言与我们平时说话是一样的,只是用在了工业中的一种交流方式。这种语言形式具有科学性、行业性、通用性三个基础要素。
分子图像识别案例,可以解释为一种工业语言提取技术。通过AI技术,可以将文献中的分子式一次性提取出来并达到识别的效果。
这项技术具有诸多应用场景:首先可以对分子结构进行检索操作,对于专利这类具有法律效力的文件,通过我们的技术可以一次性获得该专利的所有保护化合物的保护边界,极大的节省了专利分析师的人力成本,提高了效率。
本项目算法分为三个阶段:分子位置发现,使用目标检测Mask RCNN相关技术完成;原子与键的识别,使用open CV相关技术完成;原子与键的表示,使用统计关系学习概率图方式进行。
其中,化学式的表示使用MOL文件格式。
马尔科夫逻辑网络,在于通过概率的形式将推断式进行了软化。这种方法其实就是一种推断,将推断的节点增加,就变为一个网络的形式,也就是概率图。
第二个案例是我们在工业知识图谱方面的项目,工业知识图谱最重要的是将与工业生产中的知识结构化,构成知识图谱的节点进行推断。
知识图谱是当前较为流行的AI技术体系,不过在工业中运用时,需要明确具体的使用场景,具体哪些环节可以用到该技术。
如下图,在医药知识检索、投资标地、药物重定向、临床路径评估等过程中,都可以利用知识图谱的相关技术满足这些需求。
图谱的构建过程大概分为如下图阐述的几个步骤:
通常来讲,一个企业有三类数据源应该参与图谱的构建过程。
- 企业内部数据:企业在生产过程中会阐述很多经验性的内容数据,这些数据与业务结合紧密,可以作为构件图谱的数据源。
- 外部公开数据:这类数据可能是一些知识库的形式在互联网中广泛存在,比如与行业相关的行业资料,开源数据库等。
- 外部付费数据:如果企业有资金可以购买一部分付费数据,那么这部分数据具有非常规则的数据结构,可以纳入图谱中进行构建。
药物知识图谱可以筛选当前上市药物中,哪些药物对新冠病毒有疗效。诸如此类应用场景,对整个医药工业以及全民健康具有深远的意义,谢谢大家!!
#作者#
白白,公众号:白白说话(xiaob-talk)。医药行业资深产品专家,负责人工智能行业类产品综合架构与技术开发。在行业云产品架构,药物设计AI辅助、医疗知识图谱等领域有深入研究。
版权声明
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!