国内最专业的IT技术学习网

UI设计

当前位置:主页 > UI设计 >

PageRank、最小生成树:ML开发者应该了解的五种图

发布时间:2019/09/09标签:   算法    点击量:

原标题:PageRank、最小生成树:ML开发者应该了解的五种图
在互联天下中,用户不能被视为自力的实体。他们之间存在必定的关联,咱们偶然盼望在构建呆板进修模子时斟酌到这些关联。在关联数据库中,咱们无奈在差别的行(用户)之间应用这类关联,但在图数据库中,如许做十分简略。在这篇文章中,咱们将探讨一些数据迷信家应当懂得的十分主要的图算法,以及怎样应用 Python 完成它们。衔接组件咱们都晓得聚类的任务机制,你能够将衔接组件视为一种在关系/衔接数据中查找集群/集体的硬聚类算法。举个例子:假定你有衔接天下上任何两个都会途径的数据。当初你须要找降生界上全部大洲以及它们所包括的都会。你将怎样完成这一目的呢?咱们采纳的衔接组件算法是基于广度优先搜寻算法(Breadth First Search,BFS)/深度优先搜寻算法(Depth First Search,DFS)的特别情形。这里不再开展先容任务道理,咱们只看一下怎样应用 Networkx 启动和运转此代码。利用从批发角度看:假定咱们有许多客户应用大批账户。应用衔接组件算法的一种方式是在这个数据会合找出差别的族。咱们能够依据雷同的信誉卡应用情形、雷同地点、雷同手机号码来树立某些客户 ID 之间的衔接。一旦有这些衔接,咱们便可以运转衔接组件算法为有衔接的客户创立单个集群,而后为其调配一个家庭 ID。而后,咱们能够应用这些家庭 ID,依据家庭需要供给特性化推举。咱们还能够应用家庭 ID,经过创立基于家庭的分组功效来推动分类算法。从金融角度:另一个用例是应用这些家庭 ID 抓捕欺骗犯。假如某个帐户有过被讹诈阅历,那末关系帐户很轻易再次遭到讹诈。实行的能够性仅仅遭到本身设想力的限度。(设想力越丰盛,算法的利用越普遍。)代码咱们将应用 Python 中的 Networkx 模块来创立和剖析图。上面以包括都会和都会间间隔信息的图为例,完成咱们的目标。带有随机间隔的图起首创立一个带有都会名(边)和间隔信息的列表,间隔代表边的权重。edgelist=[['Mannheim','Frankfurt',85],['Mannheim','Karlsruhe',80],['Erfurt','Wurzburg',186],['Munchen','Numberg',167],['Munchen','Augsburg',84],['Munchen','Kassel',502],['Numberg','Stuttgart',183],['Numberg','Wurzburg',103],['Numberg','Munchen',167],['Stuttgart','Numberg',183],['Augsburg','Munchen',84],['Augsburg','Karlsruhe',250],['Kassel','Munchen',502],['Kassel','Frankfurt',173],['Frankfurt','Mannheim',85],['Frankfurt','Wurzburg',217],['Frankfurt','Kassel',173],['Wurzburg','Numberg',103],['Wurzburg','Erfurt',186],['Wurzburg','Frankfurt',217],['Karlsruhe','Mannheim',80],['Karlsruhe','Augsburg',250],["Mumbai","Delhi",400],["Delhi","Kolkata",500],["Kolkata","Bangalore",600],["TX","NY",1200],["ALB","NY",800]]

版权信息Copyright © 银河官网 版权所有    ICP备案编号:鲁ICP备09013610号