大色哥导航 各人专利数据何如玩才真义真义?之 聚类算法(三)
著作通过骨子应用案例,展示了聚类算法在专利数据分析中的实用性大色哥导航,为本事商议标的的挖掘提供了一种有用的门径。
一、说职场故事
在产业商议中,有以下商议需求:
知悉行业龙头企业所聚焦的本事限制。
跟踪某位各人的商议标的过甚演变。
把合手某一产业限制连年来的本事发展趋势
那今天训诫怎样运用各人专利数据来杀青这些商议看法,在此之前,让咱们先了解聚类算法的干系常识。
二、聚类算法
聚类算法是一种无监督学习门径大色哥导航,旨在将数据贯串的对象分裂为多少个类别或簇,使得归拢类别内的对象相似度较高,不同类别之间的相似度较低,简言之即是自动杀青“物以类聚,东说念主以群分”。
黑皮猪常见的聚类算法有 K-means、端倪聚类、DBSCAN、谱聚类、高斯夹杂模子、暧昧 C-means、K-medoids、Mean Shift、OPTICS、BIRCH 等,不同的聚类算法各有优错误,适用于不同类型的数据和不同的应用场景。选拔允洽的聚类算法时常取决于具体的需求、数据的特色和想象资源。不同的聚类算法先容、优错误可参考该份辛苦
三、说应用场景
聚类算法在各人专利数据挖掘中发扬着贫寒作用,可用在以下商议场景:
分析企业本事商议标的及趋势分析
分析某位各人商议标的及商议趋势
分析某个产业限制本事发展标的及趋势
1. 应用场景一:分析企业本事商议标的及趋势分析
以 A 企业为例,咱们不错通过查询其专利数据集,运用模子或第三方接口索取本事重要词,再通过聚类算法整理出本事清单,这些清单将直不雅展示企业的主要商议标的。若要不雅察企业本事演变趋势,咱们不错把柄专利的“请求日历”将数据分为不同期间段,然后通过聚类算法分析,便可揭示企业在不同期期的本事发展轨迹。经过如下:
2. 应用场景二:分析某位各人主要商议标的及商议趋势
门径同上,其中枢是取得各人的专利数据集。经过如下:
3. 应用场景三:分析某个产业限制本事发展标的及趋势
以东说念主工智能限制为例,咱们不错继承交流的门径,通过聚类算法分析连年来的本事标的,揭示该限制的本事发展趋势。经过如下:
四、写在背面的话
本章咱们商量了怎样通过聚类算法从各人专利数据中挖掘本事商议标的,需要详确的是:
(1)聚类算法不仅适用于各人专利分析,相通不错扩张到顶级期刊和各人表情数据集的分析中。
(2)聚类算法常与大型模子趋奉使用,以更精确地提真金不怕火本事重要词。
题图来自 Unsplash,基于 CC0 条约
该文不雅点仅代表作家本东说念主大色哥导航,东说念主东说念主齐是居品司理平台仅提供信息存储空间做事