全球专利数据怎么玩才有趣?之 聚类算法(三)

一、说职场故事

在产业研究中,有以下研究需求:

  • 洞察行业龙头企业所聚焦的技术领域。
  • 追踪某位专家的研究方向及其演变。
  • 把握某一产业领域近年来的技术发展趋势

那今天讲解如何利用全球专利数据来实现这些研究目标,在此之前,让我们先了解聚类算法的相关知识。

二、聚类算法

聚类算法是一种无监督学习方法,旨在将数据集中的对象划分为若干个类别或簇,使得同一类别内的对象相似度较高,不同类别之间的相似度较低,简言之就是自动实现“物以类聚,人以群分”。

常见的聚类算法有K-means、层次聚类、DBSCAN、谱聚类、高斯混合模型、模糊C-means、K-medoids、Mean Shift、OPTICS、BIRCH等,不同的聚类算法各有优缺点,适用于不同类型的数据和不同的应用场景。选择合适的聚类算法通常取决于具体的需求、数据的特性和计算资源。不同的聚类算法介绍、优缺点可参考该份资料

https://blog.csdn.net/Java_college/article/details/136173448

三、说应用场景

聚类算法在全球专利数据挖掘中发挥着重要作用,可用在以下研究场景:

  • 分析企业技术研究方向及趋势分析
  • 分析某位专家研究方向及研究趋势
  • 分析某个产业领域技术发展方向及趋势

1. 应用场景一:分析企业技术研究方向及趋势分析

以A企业为例,我们可以通过查询其专利数据集,利用模型或第三方接口提取技术关键词,再通过聚类算法整理出技术清单,这些清单将直观展示企业的主要研究方向。若要观察企业技术演变趋势,我们可以根据专利的“申请日期”将数据分为不同时间段,然后通过聚类算法分析,便可揭示企业在不同时期的技术发展轨迹。流程如下:

全球专利数据怎么玩才有趣?之 聚类算法(三)

2. 应用场景二:分析某位专家主要研究方向及研究趋势

方法同上,其核心是获取专家的专利数据集。流程如下:

全球专利数据怎么玩才有趣?之 聚类算法(三)

3. 应用场景三:分析某个产业领域技术发展方向及趋势

以人工智能领域为例,我们可以采用相同的方法,通过聚类算法分析近年来的技术方向,揭示该领域的技术发展趋势。流程如下:

全球专利数据怎么玩才有趣?之 聚类算法(三)

四、写在后面的话

本章我们探讨了如何通过聚类算法从全球专利数据中挖掘技术研究方向,需要注意的是:

(1)聚类算法不仅适用于全球专利分析,同样可以扩展到顶级期刊和全球项目数据集的分析中。

(2)聚类算法常与大型模型结合使用,以更精准地提炼技术关键词。

作者:王海涛
一位资深产品经理,将十年来 项目管理、产品管理经验以故事形式进行分享

版权声明

本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处。如若内容有涉嫌抄袭侵权/违法违规/事实不符,请点击 举报 进行投诉反馈!

立即
投稿

微信公众账号

微信扫一扫加关注

返回
顶部