基于8省区调查的农民务工收入分布特征及影响因素
作者: 崔兴林 田莉莉 张文浩 周慧 李东坡
摘 要:工资性收入占中国农村居民可支配收入的比重已超过40%,其持续增长对于巩固全面建成小康社会成果、推进农业农村现代化意义重大。利用对全国8个省区农户调查数据,引入机器学习中的K-Means聚类模型分析了农民务工收入的分布特征。构建的多元线性回归模型计量结果说明,务工天数、地区分布和类型、劳动力年龄、性别、教育培训等因素,都显著影响农民务工收入。完善农民务工收入持续增长机制,应当加强教育培训、优化务工区域分布、完善社会保障制度。
关键词:农民;务工收入;K-Means聚类;入户调查
中国分类号:F328 文献标志码:A 文章编号:1674-7909(2024)3-34-5
DOI:10.19345/j.cnki.1674-7909.2024.03.007
0 引言
2000—2022年,中国农民工资性收入占其纯收入的比重由31.1%增至42.0%,经营性收入占比则由63.3%降至34.6%[1],此变化显示务工已经成为农民最主要的收入来源。截至2022年,中国农民工总量达29 562万人,比2018年增长726万人[2]。其中,在户籍所在乡镇地域以内从业的农民工有12 372万人,占总数的41.9%;外出农民工有17 190万人,占总数的58.1%;中、东、西部及东北地区输出的外出农民工分别占外出农民工总数的36.7%、27.3%、32.5%和3.5%;外出农民工中跨省和在省内流动的分别占41.1%和58.9%;农民工的显著特征还包括女性农民工占比有所上升、平均年龄持续提高、大专及以上学历农民工占比不断提高[2]。伴随城镇化进程加快和农业转移人口增加,农民工队伍不断壮大,形成了庞大的劳动力市场。务工收入持续增长有利于巩固全面建成小康社会成果,还可促进城乡劳动力资源合理配置及分工,进而推动加速农业农村现代化进程。
已有诸多学者从多个角度对农民务工的原因和收入增长的影响因素进行了理论和实证研究。有的研究从不同类型农民耕地撂荒行为[3]、个人及家庭因素差异[4]的视角,探究了农民工外出务工的客观原因与主观动机。很多学者侧重于考察农民务工收入的特定影响因素及相应的增收策略,包括务工渠道、家庭和村庄等社会资源[5]、粮食生产区域集聚[6]、农业基础设施建设和农机服务[7]、劳动力性别差异及受教育程度[8-9]、数字经济及科技创新[10-11]、普惠金融和农业保险制度[12-14]、农村人口流动及产业结构调整[15]。这些研究的分析视角和方法具有较为广泛的代表性,但大都是从特定因素角度探讨增加农民收入的政策措施,普遍存在对务工收入关注较少、样本偏小、变量单一等局限性。基于大样本调查和实证模型较为全面把握农民工特征,特别是聚焦农民务工收入影响因素并提出切实可行对策建议的研究仍然较少。
立足科研团队掌握的数据资料、着眼弥补已有研究缺憾,此研究将基于对8个省区农民务工情况的大规模调查,构建涵盖年龄、受教育年限、非农技能培训、地区分布、健康状况、就业类型等多个维度的指标体系,引入机器学习和多元统计模型全面考察农民工收入的影响因素,在此基础上提出具有较强针对性、切实可行的政策建议。
1 数据来源及受访者特征
1.1 数据来源
此研究数据来源于2023年中国农业科学院农业经济与发展研究所主持开展的全国范围大规模农村微观经济数据调查。其作为一项定期开展的国情调查,旨在把握中国农村微观经济主体的认知和行为,为考察农业农村政策落实效果、深入开展相关科研活动和决策咨询提供一手的数据资源。调查对象包括农村、农户两部分,其中农户调查范围涉及中部地区的河南省,东部地区的河北省、福建省和山东省,西部地区的云南省、陕西省和新疆维吾尔自治区,以及东北地区的吉林省。调查内容包括农户家庭上一年度生产、收支情况,以及受访者年龄、学历、婚姻、健康状况和务工地点与类型等方面,具体的统计特征如表1所示。
1.2 受访对象的统计学特征
由表1可知,此次受访农民共计7 068人,各指标存在缺失值而导致有效样本数有所差异。受访者年均务工收入为20 657.6元,其中最大值为19.2万元,而最小值仅为2 000元,变异系数高达74.0%,说明农户间存在较大的收入差距。图1更为直观地反映了农户调查受访者年均收入的分布情况。受访农民平均48.2岁,最大和最小年龄分别是65岁和23岁,17.0%的变异系数说明受访农户务工的年龄分布比年务工收入的分布集中,其中34岁及以下青年、35~55岁中年、56岁及以上中老年受访者分别占总有效样本量的5.2%、75.5%和19.3%。受访者平均接受了8.1年教育,整体上相当于初中毕业水平(考虑存在很多45岁以上受访者接受的是5年制小学教育)。受访者平均年务工210.7 d,变异系数为43.1%说明受访者之间年务工天数差异也比较大。
受访者中来自河北、福建、山东、河南中东部4省的占64.2%,吉林省的占6.8%,云南、陕西、新疆西部3省区的占29.0%。这样的调查取样结构与各地区人口在全国所占比例较为一致。根据2022年各地区常住人口及城镇化率[1],测算可得中东部4省、吉林省、西部3省区农村人口分别占调查所涉及8省区农村总人口的68.0%、4.8%和27.2%。受访者中男性务工人员占比高达97.0%,远多于女性务工者人数;已婚者占受访者总人数的95.3%,身体健康者占受访总人数的96.7%。受访者中担任乡村两级及以上干部的仅占12.3%,即绝大部分受访者都是普通村民;68.2%的受访者在所属乡镇务工,外出务工者中选择在本县内乡镇以外、省内县外的分别占16.1%和7.7%,在国内省外、国外务工者合计仅占8.0%。91.6%的受访者没有接受过非农技能培训,62.5%的受访者选择农业为务工类型。这既体现了他们获取收入的渠道仍然相对单一,也说明增加技能培训、扩大非农就业是增加农民务工收入的重要切入点。
2 实证模型及分析结果
2.1 基于K-Means的务工收入聚类分析
K-Means聚类是机器学习中最常用的一种无监督学习算法,其基本原理是在数据中随机选择K个数据点作为各类别的重心,然后计算各样本点到各重心点的距离并按照就近原则将各样本点分类,再以各类别数据点平均值作为重心点重复上述步骤,直到各类别样本点的构成不再变化或达到规定的迭代次数。利用表1所示的各变量,运行SPSS 23.0软件的K-Means聚类模块并通过8次迭代即实现了聚类中心的稳定,将受访农民务工收入水平分为4类,分别是高收入、中高收入、中低收入和低收入。根据表2所示的分析结果,去除指标存在缺失值样本后聚类的有效样本数为6 840。其中,36.3%属于平均年收入28 202.1元的中高收入群体;其次是占有效样本量30.8%的中低收入群体,其平均年收入为17 525.0元;低收入和高收入受访者分别占有效样本量的23.5%和9.4%,后者年均收入约是前者的3.9倍。聚类结果显示,各类收入群体数量构成整体符合正态分布,但高低群体之间的年均收入悬殊。
2.2 基于多元线性回归的务工收入影响因素
利用表1中所列变量和数据构建农民务工收入影响因素的指标体系,运行SPSS 23.0软件得到多元回归分析结果见表3。表内回归模型所有自变量t值的绝对值都大于2(即相伴概率P值都小于1%),说明每个自变量都对因变量有显著影响。方差膨胀因子VIF都小于10,说明不存在多重共线性。F检验结果显示,在1%显著性水平下模型的整体拟合效果较好,能够反映各因素对受访农民务工收入的影响状况。回归模型的常量项表示自变量都为0时农民务工年均收入,现实含义不突出。未标准化系数B表示在其他因素不变时各自变量增加1个单位对因变量的影响程度。标准化系数Beta的绝对值越大则说明该因素对农户务工收入影响越显著,表3中各指标即按照该数值由大到小进行排序。
各变量的未标准化系数B说明在其他因素不变的条件下,在县域内、西部地区比在其他行业或地区工作的劳动力每人年均务工收入分别少5 482.2元和3 962.7元,年龄每增长1岁则人均年务工收入减少153.8元,以农为主的工种人均年收入少1 663.6元。农业产业务工收入较低,这主要反映了农业经济的基本属性:受农作物产量和需求价格弹性小、易受自然灾害等因素影响,导致农业经济回报率较低。与受访者绝大多数在县域内务工的调查结果结合分析,我国中东部地区得益于自然区位和经济开发较早等优势能够提供更多的务工创收机会,西部地区很多农村自然禀赋较差、经济欠发达,当地农民需要通过外出务工取得更多收入以提高生活质量。
务工天数直接反映劳动付出时间对收入的影响最为显著,务工天数每增长1天能为每人增加年均收入83.3元。群众比担任乡村干部的每人年均务工收入多2 855.6元,反映当前农村基层公务人员工资性收入偏低,并且由于忙于各项工作基本不能兼职和外出务工;群众则普遍外出务工来满足家庭各项支出需求,选择高收入工作的空间较大、务工时间较长因而收入也会显著增加。男性劳动力比女性劳动力每人年均务工收入多4 371.1元,接受过非农业类技能培训的劳动力则比未接受者每人年均务工收入高1 942.0元,体现了体力和职业技能对农民务工收入的重要影响,特别是男性在劳动力市场上有更多的优势和竞争力,能获得更多就业机会和劳动报酬。已婚的受访者比未婚、离异或丧偶者每人年均务工收入多2 469.3元,这可能是因为已婚者承担更多赚钱养家的责任,也能从家庭得到更多务工的激励和获得收入的成就感。身体健康者比体弱多病、患慢性病或重大疾病、身体残疾者年均务工收入多2 397.6元,每多接受1年教育每人年均务工收入多173.1元,可能是因为身体素质好、文化程度高的受访者更受用人单位欢迎,就业范围更广、劳动时间更长。
3 结论及对策建议
3.1 主要实证分析结论
此研究基于对中国8省区农民务工收入分布特征的调查,结合K-Means聚类分析及多元线性回归模型探究了对农民务工收入影响显著的因素。结果也表明农民之间务工收入水平存在显著差距,必须建立和完善农民务工收入均衡增长机制,以减少相对贫困人口、巩固全面建成小康社会成果。在影响务工收入的主要因素中,在县域内工作、来自西部地区、年龄偏大、以农为主的工作类型,对农民务工收入存在显著的负向影响;而每年务工天数多、没有担任基层干部职务、身为男性、接受过非农技能培训、已婚、身体健康、受教育年限长,则能显著增加农民的务工收入。
3.2 稳定增加农民务工收入的对策建议
3.2.1 加大对农民的专业技能教育
此研究表明大多数农民工受教育程度较低,很多受访农民工没有接受过非农教育培训。当前,在小规模农业经营大量存在条件下,农民单纯依靠种植业增加收入有限。这就要求政府应当加大对农民的教育培训投入,通过深入调查研究及时了解农民就业意向和技术需求,提供专业对口的多样化培训内容,完善农民工职业教育体系;还应当加大资金扶持和宣传推广力度,提高农民主动参与意识,扩大培训覆盖率。
3.2.2 优化农民务工地点的区域分布
不同地区产业结构和用工需求各不相同,相同工种在不同地区的收入水平也经常差异显著。此研究证实,我国东部地区的农民工收入高于中西部地区、县外务工收入高于县内。因此,政府要加强劳动力年龄结构、数量、技能等调查分析,协助和引导其到能够发挥最大潜能的地区务工、创业和定居;要完善城镇化政策,让小城市、县城和中心镇成为吸纳农民工创业和就业的主要载体,减少大城市和特大城市人口流入带来的超负荷压力;可以借鉴江西等地经验发布和运营好“农民工地图”[16],通过“大数据+入户调查+自主网上填报”、共享人力资源和社会保障、教育等部门政务数据等方式,准确掌握主要务工地区农民工就业状况和现实需求;在向农民工及时推送权威、实用的岗位信息的同时,根据外出务工人员实际困难和需求提供更为具体的保障服务。总之,政府应当促进农民工的合理流动,优化农民工的区位分布,以此缩小地区间的收入差距、提高农民务工收入水平。