参考:
1、 Gephi 官方教程
2、 GEPHI中文教程
3、 Gephi 入门使用
4、 介绍用Gephi进行数据可视化
5、 Gephi网络图极简教程
6、 Gephi学习笔记-画出图形基本流程
7、 Gephi快速入门指南 PDF 文档
8、 使用Gephi分析论坛社交关系网络
9、 GEPHI – Introduction to Network Analysis and Visualization
10、 Gephi的实战又美观的运用 – 用社会关系图谱筛选作弊用户
一 概述
Gephi(0.9.2)常用来分析网络关系,如社交网络好友关系等。
二 数据文件构成
- 一份关系由节点和边两个表组成。节点表存放的是各个主体,边表存放的是主体之间的关系。
- 节点:Id、Label、Interval、Modularity Class
- 边:Source、Target、Type、Id、Label、Interval、Weight
- 解释:
- Id:用来表明结点的实体
- Source、Target:两个结点,值是节点中的 Id 值。
- Type:有向或无向。
- Label:可以是名字等,也可以与 Id 一样。
- Weight:权值。
三 使用
- 具体怎样使用可见教程(参考 7)。这里主要讲解下怎样收集数据、怎样将数据导入 Gephi,对数据格式有怎样的要求。
- 补充:gephi安装好了,为何打不开?,找到 gephi 的安装路径,修改 etc 下的 gephi.conf 文件(记事本打开),将 jdkhome 的 # 号注释去掉,并设置 jre 的安装路径。如
jdkhome="C:\Program Files (x86)\Java\jdk1.8.0_172"
。
1 CSV 文件
先新建项目。
2 MySQL
- 收集数据时数据库设计:
以分析社交网络为例。分为两个表,一个表叫 Node,另一个叫 Edge。/ 然后写代码等方式收集数据写入数据库。
- Node 表属性:Id、Label。分别为微博用户的唯一 id、微博用户名
- Edge 表属性:Source、Target。分别为两个用户,表明两个用户间的关系。
- Gephi 进行分析时:
使用 Gephi 连接 MySQL 时,节点查询语句SELECT * from Node;
,边查询语句为SELECT * from Edge;
。
3 补充:设计数据库实例
使用 MySQL,设计两张表,用 MySQL 图形界面完成操作。
创建数据库:
CREATE DATABASE weibo-friends-analysis;
好友关系表,因为要使用 Gephi 进行可视化分析,所以要注意表的设计。/ 以分析社交网络为例。分为两个表,一个表叫 Node,另一个叫 Edge。/ 然后写代码等方式收集数据写入数据库。
- Node 表属性:Id、Label。分别为微博用户的唯一 id、微博用户名
- Edge 表属性:Source、Target、Weight。分别为两个用户,表明两个用户间的关系。Weight 表示第几度人脉。
1 | CREATE TABLE `weibo-friends-analysis`.`node` ( |
四 示例
- 导入是有中文,编码选 GB2312,导入第二个文件(edge.csv)时,记得选择添加到已存在的工作区。
- 注意:边文件中的权值可以设置差异大些,这样在 Gephi 中可以容易看出自己(研究用户)的点
- 背景颜色
- 节点 - 颜色 - Ranking(度)
- 节点 - 大小 - Ranking(度)
- 边 - 颜色 - Ranking(权重)- 换个颜色
- 边权重尺度
- 找到自己的点
- 格式刷(扩散可选没有、邻居)
- 字体设置为微软雅黑
- 调整好中心点的位置
- 布局使用 Force Atlas(斥力 500),也可用其它布局