基于随机森林模型的陕西小微企业和个体经营户生存发展研究
小微企业是国民经济和社会发展的重要基础,是创业富民的重要渠道,在扩大就业、增加收入、改善民生、促进稳定等方面具有举足轻重的作用。为研究陕西小微企业经营和存活特点,本文通过陕西省2014年至2019年新设立小微企业和个体经营户跟踪调查数据,分析全省新设立小微企业样本特点、运行情况及存活现状。根据调查问卷设置的指标,通过建立随机森林模型,研究指标内在结构关系,分析影响企业不同时期生存的重要因素,提出政策建议,以帮助小微企业突破发展瓶颈,保持健康稳定的发展。
一、跟踪调查样本结构情况
(一)调查样本地区分布
2014年三季度抽选新登记注册的小微企业和个体经营户进行跟踪调查,全省调查样本共1577家,其中,西安调查样本最多,占比45.5%,其次是榆林、咸阳、渭南、宝鸡,占比分别为12.2%、9%、8.4%、7.6%,商洛和铜川样本占比最少,分别为1.5%、1.3%。
(二)调查样本行业分布
全省调查样本中,企业1044家,占比66.2%,个体533家,占比33.8%。其中,第一产业调查样本占比为6.2%,第二产业占比为12.8%,第三产业占比为81%。分行业门类看,占比前五的行业门类分别是:批发和零售业,占比44.5%;租赁和商务服务业,占比8.9%;居民服务、修理和其他服务业,占比8.5%;建筑业,占比8%;农、林、牧、渔业,占比6.2%
二、陕西小微企业和个体经营户运行特点
(一)户均营业收入稳步提升,企业规模不断壮大
新设立的小微企业和个体经营户经过六年发展,历经市场洗礼,不断成熟壮大,实力不断增强。跟踪调查显示,正常经营的调查样本户均资产、户均营业收入整体呈现不断上升趋势。2019年,户均资产为184.6万元,比2014年增长了68.0%,年均增长率为10.9%;户均营业收入为87.3万元,比2014年增长了1.2倍,年均增长率为16.8%,如图1所示。
部分行业资产规模扩大、营业收入发展势头良好。资产分行业看,2019年,建筑业、科学研究和技术服务业、文化、体育和娱乐业以及农、林、牧、渔业正常营业调查样本户均资产高于平均水平,其中,建筑业户均资产为631.2万元,比2014年增长了3.5倍,年均增长率为35.4%;科学研究和技术服务业、文化、体育和娱乐业户均资产为362.1万元、320.3万元,比2014年分别增长了33.8%、48.0%。营业收入分行业看,2019年,建筑业、科学研究和技术服务业、交通运输、仓储和邮政业、文化、体育和娱乐业、信息传输、软件和信息技术服务业正常营业调查样本户均营业收入高于平均水平。其中,建筑业、文化、体育和娱乐业、信息传输、软件和信息技术服务业户均营业收入分别为369.8万元、105.1万元、102.2万元,比2014年分别增长了8.1倍、4.1倍、2.3倍。
图1 正常营业的小微企业和个体经营户经营规模变化情况 (单位:万元)
(二)人均薪酬、户均吸纳就业人数稳步提升
小微企业和个体经营户人均薪酬稳步提升,正常经营的样本户均吸纳就业人数呈上升趋势。调查显示:2019年,人均月薪酬2611元,比2018年增加了189元,增长7.8%,比2014年增加了496元,增长23.5%,如图2所示。
小微企业和个体户虽然规模不大,但准入门槛低、创办速度快,数量众多,在吸纳就业方面具有重要作用。2019年,正常经营的小微企业和个体经营户,户均吸纳就业人数为6.1人,比2014年增长了19.6%。2019年底,调查样本共吸纳就业人数为2840人,分行业看,批发和零售业、建筑业、居民服务、修理和其他服务业吸纳就业人数位居前三,分别占总人数的22.6%、17.7%、10.6%;建筑业、房地产业、交通运输、仓储和邮政业户均吸纳就业人数最多,分别为19.3、14.7、11.3人。
图2 正常营业的小微企业和个体经营户从业人数及薪酬情况
(三)经营呈稳中向好,优惠享受面扩大
调查数据显示,综合经营状况一般的企业占比由2014年的49.0%提高到2019年的53.3%,整体呈现出上升的趋势;经营状况不佳,包括经营很差和比较差的企业,占比由2014年的34.3%下降到2019年的22.6%;经营状况良好,包括很好和比较好的企业,由2014年的16.7%上升到2019年的24.2%,整体呈稳中向好状态。如图3所示。
近年来,各种扶持小微企业的税费优惠政策,尤其是2019年新一轮减税降费政策涵盖范围广、降费力度大,从小规模纳税人月销售额10万元以下免缴增值税,到小型微利获利面扩大以及“六税两费”优惠,使企业受益明显,减轻小微企业的经营压力。调查显示,2019年,享受到优惠政策的新设立小微企业和个体户的比例为61.3%,分别比2015、2018年二季度提高了21.3和11.5个百分点。享受优惠政策的340家样本单位中,92.9%的享受到了税收优惠政策,6.8%的享受到了政府资金支持或贷款优惠。
图3 正常营业的小微企业和个体户经营状况
三、陕西新设立小微企业生存情况
部分小微企业和个体经营户由于产品竞争力不强、市场需求不佳、经营不善等各种问题处于关闭停产状态;部分企业规模由小变大,员工由少变多,竞争力由弱变强,发展日益壮大。
(一)正常经营数量总体趋于稳定
据调查显示,2014年四季度,新设立小微企业和个体经营户正常营业的有928家,占调查样本的58.8%,2015-2019年四季度正常经营的数量如下图4所示,2014-2016年前三年正常经营数量下降明显,属于企业发展的瓶颈期,部分企业由于经营不善、管理不到位、产品竞争力不强等原因被市场淘汰;2017-2018年,部分企业突破了发展的瓶颈期,抵御风险能力变强,正常经营的数量相对稳定;2019年,关闭停产的企业较前两年增多。
图4 2014-2019年正常经营的小微企业和个体户数量变化
(二)第三产业企业存活率下降明显
不同行业企业生存状况呈现分化。分产业看,2019年底,第一、二、三产业企业正常经营数量占比分别为35.6%、24.4%、32.9%。2014年,第一、二、三产业的企业正常经营率分别为63.3%、47.1%、67.2%,如下图5所示。2019年和2014年相比,正常经营企业占比下降最大的为第三产业,下降34.3%,第一产业次之为27.7%,最后为第二产业,为22.7%。因为全省小微企业主要分布在第三产业中,调查样本中,批发和零售业、租赁和商务服务业、居民服务、修理和其他服务业三个行业的企业数量占第三产业为74.2%,企业同质化严重、产品附加值低,市场竞争力弱,导致关停数量较多。
图5 不同产业企业正常经营率
(三)不同行业企业存活情况分化,部分新兴行业存活率较高
部分新兴行业企业适应了市场需求,存活率较高。截止2019年,卫生和社会工作业企业存活率最高,为100.0%,其次,教育业企业为42.9%,住宿和餐饮业为40.6%,信息传输、软件和信息技术服务业为38.3%;部分行业存活率较低,制造业、建筑业、采矿业、金融业存活率分别为28.6%、21.5%、16.7%、0.0%。
表1 2014年、2019年不同行业企业正常经营情况
行业名称 |
2014年 |
2019年 |
变化值 |
农、林、牧、渔业 |
63.3% |
35.6% |
-27.7% |
采矿业 |
28.6% |
16.7% |
-11.9% |
制造业 |
52.4% |
28.6% |
-23.9% |
电力、热力、燃气及水生产和供应业 |
33.3% |
33.3% |
0.0% |
建筑业 |
44.7% |
21.5% |
-23.2% |
批发和零售业 |
68.2% |
30.9% |
-37.3% |
交通运输、仓储和邮政业 |
69.7% |
36.1% |
-33.6% |
住宿和餐饮业 |
75.8% |
40.6% |
-35.2% |
信息传输、软件和信息技术服务业 |
54.5% |
38.3% |
-16.2% |
金融业 |
57.1% |
0.0% |
-57.1% |
房地产业 |
37.9% |
29.0% |
-8.9% |
租赁和商务服务业 |
65.4% |
32.4% |
-33.0% |
科学研究和技术服务业 |
50.0% |
29.0% |
-21.0% |
水利、环境和公共设施管理业 |
22.2% |
35.3% |
13.1% |
居民服务、修理和其他服务业 |
74.6% |
33.7% |
-40.8% |
教育 |
63.6% |
42.9% |
-20.8% |
卫生和社会工作 |
100.0% |
100.0% |
0.0% |
文化、体育和娱乐业 |
81.0% |
38.1% |
-42.9% |
如表1所示,部分行业竞争激烈,关停比例高。这些行业一般门槛较低,很容易进入,竞争较为激烈,多是传统行业,整体抗风险能力较弱。例如:批发和零售业、租赁和商务服务业。部分行业正常经营率相对较高,主要这类企业适应了市场需求,进入有一定的门槛,产品或者服务具有一定的附加值。主要有卫生和社会工作、教育业、信息传输、软件和信息技术服务业等。
四、影响全省小微企业生存因素实证分析——基于随机森林模型
为了解全省新设立小微企业生存发展情况,我们从企业基本情况、财务指标和问卷情况三个方面选取不同变量指标对小微企业和个体经营户进行实证分析,通过使用随机森林模型分析新设立小微企业生存的重要因素。
(一)变量选取
1.企业基本情况:根据单位基本情况报表,选取行业类别、企业类型、创业情况、法人资本指标作为分析变量。
2.企业财务状况变量选取:选择资产总计、营业收入和从业人数等指标作为分析变量。
3.企业经营情况变量选取:根据调查问卷,选取企业经营情况、企业融资情况、企业招工情况、市场需求情况、许可证办理情况、享受优惠政策情况指标作为分析变量。
4.因变量指标:企业营业状态作为因变量,分为正常经营企业和非正常经营企业两大类,其中通过计算将停业、关闭、破产和兼并的企业合并为非正常经营企业。
表2 各变量命名及变量属性如下所示
变量名 |
符号 |
变量属性或单位 |
均值 |
企业基本情况 |
hydm |
行业大类 |
定性 |
qylx |
企业类型 |
定性 |
|
cyqk |
创业情况 |
定性 |
|
frzb |
法人资本 |
定量 |
|
企业财务情况 |
zczj |
资产总计 |
定量 |
yysr |
营业收入 |
定量 |
|
cyrs |
从业人数 |
定量 |
|
企业问卷情况 |
jyqk |
经营情况 |
定性 |
rz |
融资情况 |
定性 |
|
rjxc |
人均薪酬 |
定量 |
|
zg |
招工情况 |
定性 |
|
sj |
缴纳税金 |
定量 |
|
scxq |
市场需求情况 |
定性 |
|
xkz |
许可证办理情况 |
定性 |
|
jzzbj |
已经缴纳资本金 |
定量 |
|
yhqk |
享受优惠政策情况 |
定性 |
|
因变量 |
zt |
企业经营状态 |
定性 |
(二)数据的选取
在研究中,数据来源为全省新设立小微企业和个体经营户跟踪调查,时间为2014年4季度到2019年4季度的样本企业,每个季度的数据按照变量选择的要求进行选取。
(三)模型构建
因为小微企业和个体经营户正常经营样本和非正常经营样本在企业内部的各项因素中存在差异,因此,为了能够通过企业的情况对企业是否会正常经营进行判别,进而得出如果要促进小微企业生存发展,需要在哪些方面加大投入力度,是这次分析的目的之一,需要对数据进行分类分析。
分类分析的方法有多种。由于数据中包含大量的离散变量与连续变量,不适合进行传统回归分析。因此,为了分析企业内外部因素对企业生存发展的影响,运用现代统计学中的决策树、Bagging、AdaBoost、随机森林、支持向量机等多种方法分析探讨。
决策树能够根据若干输入变量的值构造出一个相适应的模型,来预测目标变量的值,并以树形结构呈现。Bagging算法和AdaBoost算法都是在若干基分类器(如决策树)基础上的集成算法,能够较好地提升分类效果。而随机森林也是对决策树算法的一种改进。相比之下随机森林克服了传统方法的缺点,对多元共线性不敏感,结果对缺失数据和非平衡的数据比较稳健,具有很高的预测准确率、对异常值和噪声具有很好的容忍度,且不容易出现过拟合,从而提高了预测精度。支持向量机(SVM)是建立在统计学理论的VC维理论和结构风险最小原理基础之上,根据有限样本在模型的复杂性和学习能力之间寻求最佳折中,以期获得最好的推广能力。下面简要介绍下随机森林模型。
随机森林( random forest)是一种组成式的有监督学习方法。在随机森林中,同时生成多个预测模型,并将模型的结果汇总以提升分类准确率。
随机森林的算法涉及对样本单元和变量进行抽样,从而生成大量决策树。对每个样本单元来说,所有决策树依次对其进行分类。所有决策树预测类别中的众数类别即为随机森林所预测的这样本单元的类别。
假设训练集中共有个样本单元,M个变量,则随机森林算法如下。
①从训练集中随机有放回地抽取个样本单元,生成大量决策树。
②在每一个节点随机抽取m<M个变量,将其作为分割该节点的候选变量。每一个节点处的变量数应一致。
③完整生成所有决策树,无需剪枝(最小节点为1)。
④终端节点的所属类别由节点对应的众数类别决定。
⑤对于新的观察点,所用的树对其进行分类,其类别由多数决定原则生成。
(四)实证结果分析
1.基于随机森林的企业营业状态分析
根据R软件添加包提供函数的默认节点所选变量个数和决策树数量计算出的RandomForest模型结果并非最优结果。为获得性能更好的模型,需进一步调试各节点所选变量和决策树个数。具体策略是:首先,通过逐一增加变量方法确定建立最优模型每个节点所需最优变量数,然后,再确定所需决策树个数。
由下图6可知,当每个节点的候选变量个数为3时,RandomForest模型OOB误差达到最小。如下图所示,当决策树个数大概超过500棵以后,OOB误差趋于稳定,所以将模型中的决策树数量大致确定为400。
图6 模型判断错误率与决策树数量关系图
2.随机森林模型分析结果——2014年四季度调查样本
从2014年四季度样本的分析结果可以得出,小微企业和个体经营户发展初期,营业收入、资产总计、从业人数是影响企业生存的最主要因素。无论是从移除该变量后模型精确度,还是Gini指数的下降程度来看,其重要程度均最高,说明企业生存发展初期,企业的发展规模较大,抵御风险的能力强,企业生存的生存能力也较强。
人均薪酬对企业初期存活也具有相当重要的作用,表明留住企业人才或者业务骨干对企业存在作用明显。缴纳税金、企业所处行业对企业发展也具有一定影响。
而企业融资情况、招工情况和享受优惠政策情况对企业生存的影响较小,说明在小微企业在发展初期,大部分企业对资金和人才的需求较弱,并不是决定企业发展的重要因素;同时随着国家对小微企业优惠政策力度的加大,大部分小微企业都享受了政府的优惠政策,税费负担并不十分重,是否享受优惠政策对企业的生存关联不大。如图7所示。
图7 2014年四季度样本不同变量重要性值对比
3.随机森林模型分析结果——2019年四季度调查样本
从2019年四季度分析结果可以得出,在新设立小微企业运行第六年后,人均薪酬、企业已经缴纳的资本金是影响企业生存的最主要因素。无论是从移除该变量后模型精确度,还是Gini指数的下降程度来看,人均薪酬、企业已经缴纳的资本金重要程度均最高,说明企业生存发展到一定程度,是否能够吸引或者留着人才以及企业缴纳的资本金是企业生存的重要因素。从业人数、资产总计对企业生存也具有较大影响。
营业收入、税金、经营情况、市场需求对企业的经营有显著的影响,表明小微企业在中后期要能生存下来,需要保持一定的营业收入水平,维持企业的运转。
法人资本、企业所处的行业、创业情况、企业类型等对企业生存的影响较小,说明在小微企业在发展六年后,大部分小微企业在所处行业、创业情况等,不是决定企业发展的决定性因素。如图8所示。
图8 2019年四季度样本不同变量重要性值对比
最后,通过随机森林算法对验证集中的样本单元进行分类,并计算预测准确率。总体来看,验证集的预测准确率达到94.9%。
4.主要结论和研究展望
随机森林方法是一种树型分类器的组合算法。它的优点在于能高效的处理大数据集,而且预测精度较高。在有大量相关的解释变量情况下,不需要进行变量筛选工作,评估变量的重要性时,不需要考虑一般回归问题面临的多元共线性的问题,具有一定的实际应用价值。
从随机森林建模结果来看,小微企业和个体经营户在初创时间影响生存情况的主要是企业规模,如资产总计、营业收入,而发展了六年之后最影响企业生存发展的是人均薪酬,缴纳资本金,表明六年后,留的住人才是企业生存发展的关键。
用包含企业经营情况、创业情况、融资情况、招工情况、市场需求情况等问卷指标变量对企业营业状态有一定的预测能力,从数据关系上支持了问卷设计的框架。
研究展望:本文建立的模型尚有缺陷,可能问卷设计上遗漏了重要变量,如企业经营成本情况,企业的盈利情况和企业主经营的预期等,这些都是影响模型结果准确率的主要原因。
五、对策建议
(一)加强小微企业自身建设,助推企业健康发展
“打铁还需自身硬”,通过模型分析可以看出小微企业和个体经营户在发展初期要持续健康发展最重要的还是加强自身建设。小微企业经营者要提高自身素质,选择经营项目时多作市场调研,结合自身条件确定经营范围,避免盲目跟风、恶性竞争,提高法律意识和风险意识,树立诚信经营理念,树立集体意识和团队意识,并引入现代企业经营管理模式,促进企业健康发展;同时政府部门加强引导、服务,变被动监管为主动服务,及时为小微企业选择经营项目、引进技术、管理人才等提供信息服务,积极帮助企业化解经营过程中发生的各种矛盾,引导企业走上良性竞争、有序发展之路。
(二)加强小微企业人才队伍建设,提升核心竞争力
通过模型分析可以得出在发展六年之后,人才建设对于企业生存发展起到了很重要的作用。一是加大对人才的资金投入,吸纳更多优秀人才。小微企业要加大对人力资源的管理,开展有专业性、针对性强培训、考核以及薪酬管理等。二是构筑企业文化内涵和品牌。要树立正确的企业价值观,并在企业内部宣传推广,使得企业价值观企业员工共同遵守的思想及行为规范。三是加大政策扶持力度,提升就业创业活力。加快创业创新人力资源公共服务平台建设,以“大数据+人力资源服务”模式,实现对人才队伍的精准管理。积极推行小微企业人才补贴机制,持续完善劳务用工制度建设,有效保障劳务双方的权利和义务。加强市场需求和职业教育的融合,促进高校有针对性的培养企业所需的人才。
(三)加强对小微企业行业引导,激发小微企业发展活力
一方面,小微企业敢于创新,各类新兴行业和新型业态不断涌现;另一方面又大多集中在以资源开发型、产品初加工型、服务低层次型为主的传统行业。而传统服务业则发展滞后,经济效益差,导致整体发展缺乏活力。要加大小微企业转型升级力度,加大对新兴产业和高成长行业的投力度,重点扶持发展科技创新型、出口创汇型、农副产品加工型和社会服务型等小微企业。淘汰那些技术落后、质量低劣、浪费资源的小微企业。
(四)优化创业创新,扩大小微企业发展渠道
创新创业对小微企业生存发展至关重要,传统的经济增长模式已难以为继,要繁荣市场活力,提升市场需求,必须进一步激发百姓创业创新,特别是大学生创业的积极性,通过创新创业,促进新业态、新模式的发展。要支持各地小微企业创业基地建设,培育一批示范带动作用强的省级小微企业创业示范基地。支持创新工厂、创客空间等新型众创空间发展,推动传统创业孵化机构转型。开展“互联网+小微企业”行动计划,大力推进电子商务,为中小微企业扩大渠道。
(五)构建体系,扶持小微企业发展
一是税费优惠政策。落实好小微企业引进新设备和新技术减免所得税,对进入特定新产品和新技术领域的企业实行一定期限的减免税。减免小微企业不合理的费用负担,加大对小微企业自主创新的财税支持力度。二是金融扶持政策。加快发展和完善小微企业信用担保机构,推进小微企业信贷担保体系建设,完善小微企业贷款担保制度。加大信贷扶持力度,拓宽融资渠道,解决小微企业融资困难。建立健全小微企业风险担保基金,分散小微企业发展中遇到的风险。