搜索
简帛阁>技术文章>太酷了,手把手教你用 Python 绘制桑基图

太酷了,手把手教你用 Python 绘制桑基图

class="cl-preview-section">

桑基图,它的核心是对不同点之间,通过线来连接。线的粗细代表流量的大小。很多工具都能实现桑基

图,比如:Excel、tableau,我们今天要用 Pyecharts 来绘制。

因为没有用户行为路径相关的公开数据,所以本次实现可视化是根据泰坦尼克号,其生存与遇难的人的

数据,来分析流向路径。学会思路,你也可以换成自己公司的用户行为埋点数据。

读取数据

数据来源:https://www.kaggle.com/c/titanic

Python学习交流Q群:903971231####
from pyecharts import options as opts
from pyecharts.charts import Sankey
import pandas as pd
data = pd.read_excel('/Users/wangwangyuqing/Desktop/train.xlsx')
data

 

整理数据结构:父类→子类→值

从父类到子类,每相邻的两个分类变量都需要计算,使用 Pandas 中数据透视表,计算后的数据纵向合并成三列。

Python学习交流Q群:903971231###
lis = data.columns.tolist()[:-1]
lis1 = lis[:-1]
lis2 = lis[1:]

data1 = pd.DataFrame()
for i in zip(lis1,lis2):  
    datai = data.pivot_table('ID',index=list(i),aggfunc='count').reset_index()
    datai.columns=[0,1,2]
    data1 = data1.append(datai)
data1

 

需要把所有涉及到的节点去重规整在一起。列表内嵌套字典的形式去重汇总。

# 生成nodes
nodes = []
# 先添加几个顶级的父节点
nodes.append({'name':'C港口'})
nodes.append({'name':'Q港口'})
nodes.append({'name':'S港口'})
# 添加其他节点
for i in data1[1].unique():    
    dic = {}    
    dic['name'] = i    
    nodes.append(dic)
nodes

 

组织数据:定义节点和流量

数据从哪里流向哪里,流量(值)是多少,循环+字典来组织数据

links = []
for i in data1.values:    
    dic = {}    
    dic['source'] = i[0]    
    dic['target'] = i[1]    
    dic['value'] = i[2]
    links.append(dic)
links

 

c = (
    Sankey(init_opts=opts.InitOpts(width="1200px", height="800px",theme='westeros'))
    .add(
        "",
        nodes=nodes,
        links=links,
        linestyle_opt=opts.LineStyleOpts(opacity=0.2, curve=0.5, color="source"),
        label_opts=opts.LabelOpts(position="right"),
    )
    .set_global_opts(title_opts=opts.TitleOpts(title="桑基图"))
    .render("/Users/wangwangyuqing/Desktop/image.html")
)

 

桑基图是分析用户路径的有效方法之一,能非常直观地展现用户旅程,帮助我们进一步确定转化漏斗中的关键步骤,发现用户的

流失点,找到有价值的用户群体,看用户主要流向了哪里,发现用户的兴趣点以及被忽略的产品价值,寻找新的机会。


桑基图,它的核心是对不同点之间,通过线来连接。线的粗细代表流量的大小。很多工具都能实现桑基图,比如:Excel、tableau,我们今天要Pyecharts来绘制。因为没有用户行为路径相关的公开数据
目录01从Quandl检索数据集02绘制收盘价与成交量的关系图03绘制烛台图导读:分析时间序列数据的一种简单而有效的方法就是将时间序列数据可视化在一个图表上,这样我们就可以从中推断出某些假设。本文将
言小时候,只会通过手绘来作图,但是,现在互联网发展迅速,轻松简单的就能够将一朵朵的太阳花画出来,下面我们来看看是如何做的吧~python中的turtle函数画个太阳花,有以下几个步骤1、首先,我们
目录一、开发环境二、环境搭建三、原理介绍四、效果图一、开发环境Python版本:364相关模块:pygame模块;以及一些Python自带的模块。二、环境搭建安装Python并添加到环境变量,pip安
/1前言/咱们今天就来说一下Python的虚拟环境,可能有的小伙伴会疑惑,Python的虚拟环境有什么呢?接下来我们一起来探讨一下。/2虚拟环境的作用/咱们今天就来说一下Python的虚拟环境,可能
想买mate40,但总是抢不到,所以想试着能不能写个脚本代码。第一步:把想要抢购的商品加进购物车,注意:脚本是对购物车内全部商品进行下单操作,所以不够买的商品最好先从购物车内删除。第二步:写好Pyth
心血来潮的一个想法,分享一下代码代码*coding:utf8*CreatedonSatDec1212:29:092020@author:haoyuimportturtleastimportrandom
目录前言实现总结前言春联是中国传统文化中最具内涵的元素之一,它以对仗工整、简洁精巧的文字描绘美好形象,抒发美好愿望,是中国特有的文学形式,是华人们过年的重要习俗。每逢春节期间,无论城市还是农村,家家户
现在很多同学都尝试过购买基金,毕竟这是号称最简单的懒人投资方法!然而只要基金定投就一劳永逸吗?当然不是,有哪个硬汉能忍住定投收益一点一点下跌的心痛感?这不,刚过完年,股市急转直下,众多投基者就开
Python有一个内置模块zipfile可以干这个事情,测试一波,一个测试文件,设置解压密码为123。importzipfile创建文件句柄filezipfileZipFile("测试zip",'r'