◆ ◆ ◆ ◆ ◆
前言
数据分析岗位,的确是最近两年最火爆、话题度最高的岗位。
根据从业经验、技能要求的不同,可细分为数据分析工程师、数据分析师、数据专员。
小编我特别荣幸于2017年7月份开始逐步在工作中接触到数据分析,并且运用数据分析得到的结果来指导业务,增进业绩,实现了公司数据化运营的短期目标。
可以说,我转行转的特别轻松,我是幸运的;
也可以说,我转行转的着实被动,我是被迫的。嘿嘿,看到这里,有没有想打死我的冲动?!
不管怎么说,小编我现在非常热爱数据分析师这份职业,也希望尽自己的一份努力与辛苦,帮助更多仍在迷茫中前行的萌新。
今天,给大家带来的是:基于Python——“数据分析岗位”招聘情况分析!
数据分析实战
今天,我们将用网络爬虫爬取过来的1193847条数据进行深度数据分析,剖析一下到底值不值得放弃现有的工作、成就毅然决然地转行数据分析呢?!
数据处理
异常值处理
重复值处理
空值处理
类型转换
数据分析
岗位数量、招聘人数
所处行业、工作地点
学历要求、薪资水平
分析报告
一、导包、读取数据
import pandas as pd
import warnings
import numpy as np
warnings.simplefilter(action='ignore', category=FutureWarning)
warnings.simplefilter(action='ignore', category=UserWarning)
import matplotlib as mlt
import matplotlib.pyplot as plt
%matplotlib inline
# 读取txt格式的数据
dataset = pd.read_table(r'C:/Users/Administrator/Desktop/recruits.txt',low_memory = False)
dataset.info()# 全览数据可以发现:数据缺少字段名
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 1193846 entries, 0 to 1193845
Data columns (total 13 columns):
940864 1193846 non-null int64
UI 1193846 non-null object
用户界面(UI)设计 1193846 non-null object
8001-10000 1193846 non-null object
3-5 1193846 non-null object
本科 1193846 non-null object
全职 1193846 non-null object
2017-11-15 1193846 non-null object
1 1193846 non-null object
杭州****技术有限公司 1193846 non-null object
计算机软件 119