数据可视化软件 Gephi 的基本使用

作者 Marlous 日期 2019-04-03
数据可视化软件 Gephi 的基本使用

参考:
1、 Gephi 官方教程
2、 GEPHI中文教程
3、 Gephi 入门使用
4、 介绍用Gephi进行数据可视化
5、 Gephi网络图极简教程
6、 Gephi学习笔记-画出图形基本流程
7、 Gephi快速入门指南 PDF 文档
8、 使用Gephi分析论坛社交关系网络
9、 GEPHI – Introduction to Network Analysis and Visualization
10、 Gephi的实战又美观的运用 – 用社会关系图谱筛选作弊用户

一 概述

Gephi(0.9.2)常用来分析网络关系,如社交网络好友关系等。

二 数据文件构成

  1. 一份关系由节点和边两个表组成。节点表存放的是各个主体,边表存放的是主体之间的关系。
  • 节点:Id、Label、Interval、Modularity Class
  • 边:Source、Target、Type、Id、Label、Interval、Weight
  1. 解释:
  • Id:用来表明结点的实体
  • Source、Target:两个结点,值是节点中的 Id 值。
  • Type:有向或无向。
  • Label:可以是名字等,也可以与 Id 一样。
  • Weight:权值。

三 使用

  • 具体怎样使用可见教程(参考 7)。这里主要讲解下怎样收集数据、怎样将数据导入 Gephi,对数据格式有怎样的要求。
  • 补充:gephi安装好了,为何打不开?,找到 gephi 的安装路径,修改 etc 下的 gephi.conf 文件(记事本打开),将 jdkhome 的 # 号注释去掉,并设置 jre 的安装路径。如 jdkhome="C:\Program Files (x86)\Java\jdk1.8.0_172"

1 CSV 文件

先新建项目。
CSV 文件

2 MySQL

MySQL

  1. 收集数据时数据库设计:
    以分析社交网络为例。分为两个表,一个表叫 Node,另一个叫 Edge。/ 然后写代码等方式收集数据写入数据库。
  • Node 表属性:Id、Label。分别为微博用户的唯一 id、微博用户名
  • Edge 表属性:Source、Target。分别为两个用户,表明两个用户间的关系。
  1. Gephi 进行分析时:
    使用 Gephi 连接 MySQL 时,节点查询语句 SELECT * from Node;,边查询语句为SELECT * from Edge;

3 补充:设计数据库实例

使用 MySQL,设计两张表,用 MySQL 图形界面完成操作。

  1. 创建数据库:CREATE DATABASE weibo-friends-analysis;

  2. 好友关系表,因为要使用 Gephi 进行可视化分析,所以要注意表的设计。/ 以分析社交网络为例。分为两个表,一个表叫 Node,另一个叫 Edge。/ 然后写代码等方式收集数据写入数据库。

  • Node 表属性:Id、Label。分别为微博用户的唯一 id、微博用户名
  • Edge 表属性:Source、Target、Weight。分别为两个用户,表明两个用户间的关系。Weight 表示第几度人脉。
1
2
3
4
5
6
7
8
9
10
11
CREATE TABLE `weibo-friends-analysis`.`node` (
`id` VARCHAR(20) NOT NULL,
`label` VARCHAR(32) NOT NULL,
`gender` CHAR(1) NOT NULL,
PRIMARY KEY (`id`));

CREATE TABLE `weibo-friends-analysis`.`edge` (
`source` VARCHAR(20) NOT NULL,
`target` VARCHAR(20) NOT NULL,
`weight` INT(1) NOT NULL,
PRIMARY KEY (`source`, `target`));

四 示例

Gephi 的处理操作

  • 导入是有中文,编码选 GB2312,导入第二个文件(edge.csv)时,记得选择添加到已存在的工作区。
  • 注意:边文件中的权值可以设置差异大些,这样在 Gephi 中可以容易看出自己(研究用户)的点
  • 背景颜色
  • 节点 - 颜色 - Ranking(度)
  • 节点 - 大小 - Ranking(度)
  • 边 - 颜色 - Ranking(权重)- 换个颜色
  • 边权重尺度
  • 找到自己的点
  • 格式刷(扩散可选没有、邻居)
  • 字体设置为微软雅黑
  • 调整好中心点的位置
  • 布局使用 Force Atlas(斥力 500),也可用其它布局