一、剖析演说的绍介

保险是近两年来的一任一某一上市后不久价格猛涨的股票。,我这次的演说是网上认识到了数据剖析中间定位奔流以后的工程毕业作业。这项作业将诱惹中国保险的根本数据。,看一眼欲望和保证保险的位。,过来的开展和接洽的驱动力。

这人作业早已被选择了过来两年,我更感兴趣。,浅析保险我通常亲密关怀的保险,从选题,数据夺取,建模剖析孤独做完,继续了一任一某一星期,这花了很多工夫。。不管怎样这份演说对现实欲望来说比分却浅薄的。,但它也给了我一任一某一地租的忧虑。,体会数据开掘/数据剖析的全过程。。最大的觉得是最重要的和最好的。,极盛时数据,良好的数据。,后头,剖析建模屡次地是将会的。。

另外,保险内幕的消息与知识点,我也道谢的话我的亲自的保险代理人Lu Ying的忘我扶助。。

二。运用的次要器。

女用长围巾版本: Python3.6
jupter notebook: Anaconda3-.0-Windows-x86_64
pandas:数据剖析朗读数据
matplotlib:一块地
rcParams:用来标准的显示国文,并设置国文字

三.保险数据收集

这次演说的数据是经过和讯保险翻书页收集自2013年1月至2018年9月的保险欲望根底数据,总预防办法次要是预防办法。,各类预防办法,补苴损失总计达,杂多的保险类别偿还数据。
喂省略了称呼委任的数据匍匐编码。。

四。数据洗涤与预期

经过数据匍匐阶段,朕如愿以偿了所局部数据结合一任一某一以月为辨识称标记的二维队列(total_data),接下来,朕必要对数据停止预期。,包罗of Dataframe发作,检查数据降落和背面的形态,添加降落和更新的行动或事例背面的数据。

import pandas as pd
import numpy as np
a = np.vstack(total_data)
柱_name =[雇用,原预防办法进项,手段保险进项,亲自的总保险进项。,人寿保险费进项,康健保险进项,亲自的事变保险进项,原保险补苴损失总支出额,手段预防办法用,寿险总本钱,寿险支出额,麦克匪特斯氏疗法预防办法用,亲自的不测预防办法用]
df = pd.数据文献(data = a,= 柱_name)

df.date = pd.to_datetime(df.date)
df.set_index(雇用,inplace =True)

df1 = df.loc[:,:].astype(float)

鉴于数据是长度的的。,因而朕可以经过画个图本人去看数据收集设想完整的,有什么背面的吗?。
###############################################
####本段质地是为了处理图画无法显示国文字的成绩,假定可以显示国文则离表演本段质地
称呼委任默许字 你必要先下载因特网。 文献放入 ~\Anaconda3\Lib\site-packages\matplotlib\mpl-data\fonts\ttf 中,和按顺风的次爆震音。:

import matplotlib
matplotlib.rcParams['''']=[西米椰子] 
matplotlib.rcParams['''']=无衬线
matplotlib.rcParams['''']=False

###############################################

from matplotlib import pyplot as plt
%matplotlib inline
df1.plot(figsize=(16,9))

在喂插入图片描述

战场表露,朕可以注意2016的后半切断。,1月17日,decorate 装饰数据缺乏,另外,7月16日, 在杏月如月和8月18日,线中有突然下跌。,预测数据背面的率是背面的的。。喂的数据打勾仅仅人工操作输出。,更新的行动或事例数据来源于保险价格波动的官方网站。

官方网站数据翻书页不价格波动。,多种多样的翻书页的组织体式无特征性。,为了,它不直截了当地作为数据发送器采样。。

df2 = df1.replace(0,np.nan)
data1608 =[22958.9373,5635.0848,17323.8524,13721.4564,3098.2305,504.1655,6901.1431,2937.1279,3964.0152,3242.7249,60101,115.9803]
data1609 =[25168.2615,6370.5827,18797.6788,14783.8733,3430.4069,583.3985,7750.6999,3321.5870,4429.1129,3610.5333,687.1908,131.3888]
data1610 =[27010.3752,7018.3821,19991.9932,15703.9707,3647.7410,640.2814,8526.1670,3670.1245,4856.0425,3946.5561,763.4167,146.0697]
data1611 =[28864.8711,7773.0544,21091.8167,16556.6817,3841.7960,693.3390,9450.0194,4131.1226,5318.8968,4287.5209,870.7195,160.6564]
data1701 =[8553.4033,973.8127,7579.5907,6861.5894,641.1138,76.8875,1277.2914,419.6850,857.6063,729.5261,109.4866,18.5937]
data1712 =[36581.0074,9834.6579,26746.3495,21455.5650,4389.4604,901.3241,11180.7933,5087.4496,6093.3437,4574.8907,1294.7670,223.6859]
data1612 =[30959.1009,8724.4981,22234.6028,17442.2167,4042.4968,749.8893,10512.8900,4726.1839,5786.7061,4602.9462,1000.7522,183.0077]
df2.loc[''2016-08-01'']= pd.Series(data1608,index = df2.)
df2.loc[''2016-09-01'']= pd.Series(data1609,index = df2.)
df2.loc[''2016-10-01'']= pd.Series(data1610,index = df2.)
df2.loc[''2016-11-01'']= pd.Series(data1611,index = df2.)
df2.loc[''2017-01-01'']= pd.Series(data1701,index = df2.)
df2.loc[''2017-12-01'']= pd.Series(data1712,index = df2.)
df2.loc[''2016-12-01'']= pd.Series(data1612,index = df2.)
df2.loc[''2016-07-01''][原保险补苴损失总支出额], df2.loc[''2016-07-01''][人寿保险费进项]= df2.loc[''2016-07-01''][人寿保险费进项], df2.loc[''2016-07-01''][原保险补苴损失总支出额]
df2.loc[''2018-02-01''][-1],df2.loc[''2018-02-01''][-3]= df2.loc[''2018-02-01''][-3], df2.loc[''2018-02-01''][-1]
df2.loc[''2018-08-01''][-1]= df2.loc[''2018-08-01''][-4]-df2.loc[''2018-08-01''][-3]- df2.loc[''2018-08-01''][-2]
df2.plot(figsize=(16,9))

在喂插入图片描述

检查官方网站后。,朕也瞥见,每个月的数据现实上是自正月以后的数据总和。,而挑剔单月数据。,这中间朕而且正月不同于除此之外数据。,他们必要从月前的一任一某正月减去数据。,以算出真正该月发作的保险数据。

df_month = df2.copy()

i =len(df_month)while i >0:
    i -=1if(df_month.index[i]).to_pydatetime().month ==1:continueelse:
        df_month.loc[df_month.index[i]]-= df_month.loc[df_month.index[i]- pd.DateOffset(months=1)]
df_month.plot(figsize=(16,9))

在喂插入图片描述

其次,战场每月一次的数据样式使驻扎和年度数据。

df_year = df_month.resample(''Y'').sum()
df_quarter = df_month.resample(''Q'').sum()

五.数据剖析阶段

数据剖析阶段,朕将分为涌现的数据形态剖析。,在过来三个田的统计数字资料剖析和接洽形态PRED。

涌现保险位剖析

朕将经过对2018年保险进项和支出额的饼图来停止涌现保险的形态剖析。
2018年度附加费进项和补苴损失列于表上
率先下定义一任一某一简略的应变量。,生产饼图何止显示洁治,您还可以显示称呼委任的数字。

defpct_number(pct, data):
    number =float(pct/100.*np.sum(data))return"{:.2f}%\n({:.2f} 亿元)".format(pct, number)

fig, axes = plt.subplots(nrows =1, ncols =2,figsize =(14,6))
axes[0].axis(匀度)
axes[1].axis(匀度)

labels0 =[手段保险进项,人寿保险费进项,康健保险进项,亲自的事变保险进项]
labels1 =[手段保险补苴损失,人寿保险费报账,康健保险补苴,容貌事变保险。]

axes[0].set_title("2018 保险进项", fontsize =20)
axes[1].set_title("2018 保险补偿", fontsize =20)
axes[0].pie(df_year.iloc[-1,[1,3,4,5]], labels = labels0,autopct =lambda pct: pct_number(pct, df_year.iloc[-1,[1,3,4,5]]))     
axes[1].pie(df_year.iloc[-1,[7,9,10,11]], labels = labels1,autopct =lambda pct: pct_number(pct, df_year.iloc[-1,[7,9,10,11]]))

在喂插入图片描述
经过2份饼图中保险洁治和本钱的显示,朕可以明亮的地注意。:

1。保险进项的一切断,人寿保险费占了近60%的命运注定。,是保险代理人对立的营收大头。不管怎样,在支出额切断,人寿保险费挑剔最贵的。,同时,进项和支出额私下的差数也很大。。

纵然为什么会形成很的数据差距呢?果真懂点商业保险的都察觉简单的的人寿保险费平行保额对应的附加费遍及并不会的比康健险更贵,因而喂的人寿保险费是个普通的术语。,就亲自的说起,据我的观点很大一切断将会称为年金保险。。年金保险也堵塞寿险的一种人寿保险费。,为了,把人寿保险费类划分为类别也可以忧虑的。。

同时,年金保险的结局和结局要点。,安宁保险是短期或时限结局小额预防办法。,保险后如愿以偿未损坏的保险补苴损失,说穿了执意安宁不出险人的附加费都赔给出险的人了。
纵然年金险的要点则是投保人必要短期或时限缴大额附加费后,被保险人每年或许归休以后才干收到商定的的小量定额补偿,纵然补偿次数/退休年龄一向继续直到被保险人逝世为止。喂的补偿费用的是投保人早期交的大批附加费后,保险代理人用这笔钱理财盈余所得。也执意用的执意本人的本钱,和对立的事物附加费无干。
另外,年金险普通还会同时卖一任一某一权力无限的险,供给物高利息率的筑储蓄认为。,这是另一任一某一大杀人者。。

年金保险的进项很高。,低补偿的要点使人寿保险费相当高峰。

2。亲自的不测损伤保险与康健保险进项支出额,仅仅2%和15%。,这两类保险并挑剔保险代理人的重中之重。。纵然,这两类进项和支出额私下的差距也OBV。,这弄清它们也有良好的开展太空。。

3.财险进项占比不到三成却要支出额四成五的补偿,使手段保险占债权洁治最重要的。。手段保险亲手太复杂了。,从汽车保险,房屋险,对麻子,搁浅,甚至杂多的信誉债务。,它与人寿保险费无干。。亲自的手段保险代理人,它的承保工程每年都在发作。,自然的事情和报酬事变的音量可能会庞大地碰撞得益。,但对全部集市来说。,手段保险集市是一任一某一戒毒波动的集市。。

过来统计数字资料剖析

在附近的过来的统计数字,朕将剖析附加费进项和COMP总计的两个田。。


my_colors =[''r'',''g'',''y'',''b'']

fig, axes = plt.subplots(nrows =2, ncols =1,sharex =True,figsize =(16,12))  

df_quarter.iloc[:,[1,3,4,5]].plot.bar(figsize =(16,9),ax = axes[0],color = my_colors)
df_quarter.iloc[:,[7,9,10,11]].plot.bar(figsize =(16,9),ax = axes[1],color = my_colors)

axes[0].set_title(使驻扎保险进项,fontsize =15)
axes[1].set_title(使驻扎保险覆盖率,fontsize =15)

axes[1].set_xlabel("日期")
axes[1].set_ylabel("单位: 亿元")
axes[0].set_ylabel("单位: 亿元")

patches, labels = axes[0].get_legend_handles_labels()
axes[0].legend(patches, labels, loc =2)

在喂插入图片描述
从2013年到这点为止的保险各险种使驻扎进项和补偿条线图朕可以注意:

1。从附加费进项的角度,人寿保险费和手段保险进项的总计达为。在内部地寿险在每年的最重要的使驻扎总能量绝尘,与安宁杂多的保险的宏大差距。。究其导致,现实上是后面提到的年金保险。。鉴于年金保险的弱小进项,每年新年伊始,每家保险代理人大都会寿险。,这些聚焦根本上是年金保险。。这就形成了最重要的使驻扎高峰的附加费进项。

2。从附加费结局,率先,朕可以瞥见Y轴变换了一任一某一整个的浆糊。,这弄清保险的整个得益才能仍然是E。。其次,不管怎样人寿保险费仍然是人头挤挤。,但残忍的说起,手段保险的总本钱显然更大。,这也契合PII中所显示的保险债权洁治。。根据为什么最重要的使驻扎寿险赔的也特殊多呢?自然是鉴于年金险这人使驻扎签得多,鉴于年金保险是每年结局的。,自然的事情,异样的季会开支更多。。 风趣的是,手段保险老是在第四音级使驻扎结局至多。,它将会在几年前与你平方认为。,每年的停止盈亏统计数字。。

from matplotlib.ticker import FuncFormatter

df_month_rate = df_month.pct_change(periods =12).iloc[12:,:]
  
fig, axes = plt.subplots(nrows =2, ncols =1,figsize =(16,12))

df_month_rate.iloc[:,[3,4]].plot(color=[''g'',''y''], ax = axes[0],figsize=(16,12),grid=True)
df_month_rate.iloc[:,[1,5]].plot(color=[''r'',''b''], ax = axes[1],figsize=(16,12),grid=True)defto_percent(temp, position):return''%.f''%(100*temp)+''%''for i inrange(0,2):
    axes[i].十字轴.set_major_formatter(FuncFormatter(to_percent))
    axes[i].set_ylabel("同比增长速率")
    axes[i].set_xlabel("日期")
    axes[i].axhline(y=0, color=黑色, lw=2)
    
axes[1].set_title("财险/事变保险月同比增长速率",fontsize=15)
axes[0].set_title("寿险/康健险月同比增长速率",fontsize=15)

在喂插入图片描述
从小群后的月同比增长速率朕可以注意:

1.战场Y轴的数值,只好来说各险种进项和补偿都坐落在快车道的增长中,阐明我国保险近几年开展速度迅猛。

2.从各险种说起,朕可以注意康健险进项的同比增长速率在2017年先前明显的高于安宁险种,增幅最高点可以超越125%。事先干舷的增长速率次要是鉴于16岁末前集市有很多带理财属性的短期/时限康健险(很多都是直截了当地筑当有保险效能的理手段品代卖),受到事先客户的热捧。

不管怎样朕可以注意康健险的同比增长速率自16岁末开端涌现急跌,17年中旬和18年开年甚至录等等负增长。其在后面较远处的导致是鉴于自16年中旬开端,中间定位接管机构和高层就开端放出“保险信保”动机,询问欲望回归原料来源,大力开展保证型商品,而挑剔吸取资产只求上胶料,弃权形成潜在财政体制风险。以其对应的是先后出场多项红头文献和办法,根绝了康健险同年金险相似的朝偏理手段品的翻转。

纵然哪怕为了,果真康健险同比增长速率也并非强弩之末,17年后期及18年中期仍可以录得快车道的增长速率,阐明了康健险在更注意保证以后仍然有宽广的开展太空,这是鉴于75,80后的人开端保险察觉的逐步意识到,很多人开端自觉的去听说保险,自动买卖保险。这种自动行动目的都是以重疾险,麦克匪特斯氏疗法险等康健险为主震相的。

相在附近的康健险的干舷增长,寿险的增长速率略低,且自16初后如同就开端进入衰退通行。次要导致完全相同的“保险信保”的策略变换式导致的。特殊是17年10月开端实行的著名的134号文献,对年金险很多短时间做成的修复,高额利息率等有潜在风险的欲望做法做了更顽固的的规则和限度局限,由此使年金险作为理手段品的引力大幅衰退。

3.相在附近的前两个险种说起,财险和容貌事变保险的同比增长速率不管怎样缺勤超快车道的增长速率,纵然胜在波动,几年来都能遵守在一任一某一区间中,在内部地事变保险的小体量也成为预兆着更大的开展太空。

接洽形态预测

鉴于保险数据正是规整的使驻扎性,很相称用prophet器停止工夫序列的剖析和预测。朕会对各保险在接洽三年内停止附加费进项,月同比增长速率此外各险种在总保险进项中间的占比停止预测。

from fbprophet import Prophet
import warnings
warnings.filterwarnings(''ignore'')

以下是各保险在接洽三年内附加费进项预测

defprophet_image(df,periods,ax):
    df = df.reset_index()
    df.=[''ds'',''y'']
    m = Prophet()
    m.fit(df)
    future = m.make_future_dataframe(periods=periods, freq=''M'')
    forecast = m.predict(future)
    fig = m.plot(forecast,ax=ax)
fig, axes = plt.subplots(nrows=2, ncols=2,figsize=(14,8))

prophet_image(df_month.iloc[:,1],39,axes[0,0])
prophet_image(df_month.iloc[:,3],39,axes[0,1])
prophet_image(df_month.iloc[:,4],39,axes[1,0])
prophet_image(df_month.iloc[:,5],39,axes[1,1])for i inrange(0,2):for j inrange(0,2):
        axes[i,j].set_ylabel("单位: 亿元")
        axes[i,j].axvline(x=''2018-09-01'',ls="--",color="y", lw=1)

axes[0,0].set_xlabel("财险附加费接洽三年预测")
axes[0,1].set_xlabel("寿险附加费接洽三年预测")
axes[1,0].set_xlabel("康健险附加费接洽三年预测")
axes[1,1].set_xlabel("容貌事变保险附加费接洽三年预测")

在喂插入图片描述
从四种险种的接洽三年附加费进项预测图中朕可以注意:

1.每个险种的附加费进项仍可以稳步增长,欲望整个增长的基石仍然在。,这人欲望完全相同的很找矿的。。

2。朕也可以从弄斜上注意。,寿险附加费预测的斜率明显的在水下,商量弄清,寿险(年金保险)受上胶料和PO的碰撞。,开展趋缓。

3.每个图中折叠线边缘地带的蓝色职务切断记号着此点对应日期所预测数值的团圆余地。手段保险和事变保险都很小。,比分弄清,这两类保险的运转数据是明显的的。,为了预测值很小。。人寿保险费和康健保险更受策略的碰撞。,过来数据的匀称很差。,为了,预测值的色散度也较高。。

末版,朕将看一下总预防办法的趋向。。

fig, axes = plt.subplots(nrows=2, ncols=2,figsize=(16,8))

prophet_image(df_month.iloc[:,1]/df_month.iloc[:,0],39,axes[0,0])
prophet_image(df_month.iloc[:,3]/df_month.iloc[:,0],39,axes[0,1])
prophet_image(df_month.iloc[:,4]/df_month.iloc[:,0],39,axes[1,0])
prophet_image(df_month.iloc[:,5]/df_month.iloc[:,0],39,axes[1,1])for i inrange(0,2):for j inrange(0,2):
        axes[i,j].十字轴.set_major_formatter(FuncFormatter(to_percent))
        axes[i,j].set_ylabel("占比 %")
        axes[i,j].axhline(y=0,ls="--",color="black", lw=1)
        axes[i,j].axvline(x=''2018-09-01'',ls="--",color="y", lw=1)

朕可以从每个保险典型的洁治预测图中看出。,手段和人寿保险费的命运注定将逐步压缩制紧缩。,麦克匪特斯氏疗法保险和事变保险的洁治将逐步膨胀物。。这也成为预兆着接洽集市开展的作主旨发言和支座。。

六。数据剖析与总结

鉴于近五年来保险根本数据的剖析,朕可以察觉,

最重要的,保险务具有宏大的进项和支出额。,未损坏的附加费进项最结果流入全部金融集市,在全部财政体制中可疏忽的角色和位。

在附近的称呼委任典型的保险,手段保险集市普通是波动的和孤独的。,开展良好。人寿保险费集市,在过来和可预示的未来,人寿保险费(年金保险)集市将相当每个保险代理人的要件。,宏大生产能力,收益最厚的部分。但策略证实,同乡保险察觉的意识到,康健险和容貌事变保险早已开端奋发图强,他们将是接洽新生的增长点。

发表评论

电子邮件地址不会被公开。 必填项已用*标注