关注公众号:『AI学习星球』
回复:宠物小精灵 即可获取数据下载。
算法学习、4对1辅导、论文辅导或核心期刊可以通过公众号或➕v:codebiubiubiu滴滴我
精灵宝可梦系列是一套由日本任天堂株式会社于1996年推出的一款游戏。独特的游戏系统广受大众的欢迎,年度产品销量近千万。
精灵宝可梦作品包括游戏、动画、漫画、卡片游戏及相关产品。宝可梦同时也是宝可梦世界所有虚构出来的物种所拥有的共同的名字。截至2017年10月,全系列的宝可梦共有805种。
基于此,我们可以对Pokémon的数据/变量进行统计分析,并从中发掘他们之间的关系,用可视化的方式进行直观的查看。
# 引入必要的包 import csv import os import numpy as np import pandas as pd import matplotlib.pyplot as plt import seaborn as sns 1234567
plt.rcParams['font.sans-serif'] = ['SimHei'] # 指定默认字体 plt.rcParams['axes.unicode_minus'] = False # 解决保存图像是负号'-'显示为方块的问题 12
pokemon_data = pd.read_csv('pokemon.csv') pokemon_data.head() 12
4.1 单变量分析plt.figure(figsize=(10, 5)) # Type_1 的数量统计图 ax1 = plt.subplot(1, 2, 1) sns.countplot(x='Type_1', data=pokemon_data) plt.title('主要类别的数量统计') plt.xticks(rotation='vertical') plt.xlabel('主要类别') plt.ylabel('数量') # Type_2 的数量统计图 plt.subplot(1, 2, 2, sharey=ax1) sns.countplot(x='Type_2', data=pokemon_data) plt.title('副类别的数量统计') plt.xticks(rotation='vertical') plt.xlabel('副类别') plt.ylabel('数量') plt.tight_layout() 1234567891011121314151617181920
plt.figure(figsize=(10, 5)) # Egg_Group_1 的数量统计图 ax1 = plt.subplot(1, 2, 1) sns.countplot(x='Egg_Group_1', data=pokemon_data) plt.title('蛋群分组1的数量统计') plt.xticks(rotation=60) plt.xlabel('蛋群分组1') plt.ylabel('数量') # Egg_Group_2 的数量统计图 plt.subplot(1, 2, 2, sharey=ax1) sns.countplot(x='Egg_Group_2', data=pokemon_data) plt.title('蛋群分组2的数量统计') plt.xticks(rotation=60) plt.xlabel('蛋群分组2') plt.ylabel('数量') plt.tight_layout() 1234567891011121314151617181920
# 其余单变量数量统计 plt.figure(figsize=(10, 5)) # isLegendary 的数量统计图 ax1 = plt.subplot(2, 3, 1) sns.countplot(x='isLegendary', data=pokemon_data) plt.title('是否为传说类型的数量统计') plt.xlabel('是否为“传说”') plt.ylabel('数量') # hasGender 的数量统计图 plt.subplot(2, 3, 2, sharey=ax1) sns.countplot(x='hasGender', data=pokemon_data) plt.title('是否有性别的数量统计') plt.xlabel('是否有性别') plt.ylabel('数量') # hasMegaEvolution 的数量统计图 plt.subplot(2, 3, 3, sharey=ax1) sns.countplot(x='hasMegaEvolution', data=pokemon_data) plt.title('是否有Mega进化的数量统计') plt.xlabel('是否有Mega进化') plt.ylabel('数量') # 颜色 的数量统计图 plt.subplot(2, 3, 4) sns.countplot(x='Color', data=pokemon_data) plt.xticks(rotation=60) plt.title('颜色的数量统计') plt.xlabel('颜色') plt.ylabel('数量') # 身形 的数量统计图 plt.subplot(2, 3, 5) sns.countplot(x='Body_Style', data=pokemon_data) plt.xticks(rotation=90) plt.title('身形的数量统计') plt.xlabel('身形') plt.ylabel('数量') # 第n代 的数量统计图 plt.subplot(2, 3, 6) sns.countplot(x='Generation', data=pokemon_data) plt.title('第n代的数量统计') plt.xlabel('第n代') plt.ylabel('数量') plt.tight_layout() 123456789101112131415161718192021222324252627282930313233343536373839404142434445464748
# 数值型数据分布统计 plt.figure(figsize=(10, 5)) numeric_cols = ['Total', 'HP', 'Attack', 'Defense', 'Sp_Atk', 'Sp_Def', 'Speed', 'Pr_Male', 'Height_m', 'Weight_kg', 'Catch_Rate'] for i in range(len(numeric_cols)): plt.subplot(4, 3, i + 1) sns.distplot(pokemon_data[numeric_cols[i]].dropna()) plt.xlabel(numeric_cols[i]) plt.tight_layout() 1234567891011
4.2 变量间关系分析plt.figure() sns.pairplot(pokemon_data.dropna(), vars=numeric_cols, size=1) 12
corr_df = pokemon_data[numeric_cols].corr() corr_df 12
plt.figure() # 关闭格子线 (grid line) ax = plt.gca() ax.grid(False) plt.imshow(corr_df, cmap='jet') plt.xticks(range(len(numeric_cols)), numeric_cols, rotation='vertical') plt.yticks(range(len(numeric_cols)), numeric_cols) plt.colorbar() plt.tight_layout() 1234567891011
该项目通过分析Pokemon数据,实践了Python数据分析常用的可视化操作,包括:
单变量数据可视化变量间关系可视化关注公众号:『AI学习星球』
回复:宠物小精灵 即可获取数据下载。
算法学习、4对1辅导、论文辅导或核心期刊可以通过公众号或➕v:codebiubiu滴滴我
相关知识
京东数据挖掘(京东运营数据分析):2023年宠物行业数据分析报告
宠物用品零售数据分析
探索性数据分析—赛事数据集(Ⅰ)
宠物数据分析图怎么做
SPSS前后测数据分析:对比分析方法
宠物饲养数据分析怎么写
【数据分析实战】—预测宠物收养状况数据分析
淘宝宠物直播场次数据分析
宠物商业数据分析
社交媒体数据分析的可视化展示:让数据讲述故事
网址: 数据分析 https://m.mcbbbk.com/newsview728520.html
上一篇: 宠物小精灵 android游戏, |
下一篇: 宠物精灵猫狗翻译器 |