数字治理||赵一璋:中国数字鸿沟的演变趋势:来自CGSS2005-2021的证据
引言
数字鸿沟概念最初聚焦于互联网接入机会的不均衡分布,即所谓第一级数字鸿沟(the first-level digital divide)。随着网络基础设施的完善与数字设备在社会各阶层的普及,学界研究重心逐步转向数字技能与使用模式的区隔,以及由此产生的收益与成果差异,进而衍生出第二级与第三级数字鸿沟的层级划分。
对数字鸿沟三个层级的研究不仅表明社会学家对社会不平等问题的长期关注,同时也反映出数字领域议题与社会不平等之间日益增强的关联性(DiMaggioet al.,2001;DiMaggio& Bonikowski,2008)。尽管传统社会不平等研究聚焦于阶级、种族与性别维度(Hsin& Xie,2014;Wu,2019;Xie& Jin,2015),但随着信息获取能力与数字工具掌握程度对个体生活机遇的决定性作用日益凸显,数字不平等正逐步成为与传统分层分析范式并列的新型分析范式(Van Dijk,2020)。恰如Robinson等学者所言:“若无法理解数字不平等,便无从把握二十一世纪的社会图景。”
基于此,本研究构建实证分析框架,聚焦中国语境展开系统性考察。本研究依托中国综合社会调查(CGSS)2005-2021年多期数据,着力回应两大核心议题:第一,观测期内中国数字不平等呈现何种演进轨迹?当代社会数字不平等的主要形态特征是怎样的?第二,数字不平等如何与传统分层机制相互作用?基于当前社会分层格局,哪些群体在数字时代处于最为弱势的地位?通过对上述问题的解析,本研究旨在揭示新兴数字不平等与传统社会分层机制交织所产生的复杂效应,进而阐明数字时代社会分层结构的叠变逻辑。
图. 编者制作的全文思维导图
建构数字鸿沟研究的分析框架
就数字鸿沟三层次的理论意涵而言,学界普遍认同其具有逐层递进的内在逻辑(Van Dijk,2006、2020;Wei et al,2011)。第一级数字鸿沟聚焦互联网接入机会的差异,这是数字不平等研究的逻辑起点——唯有确立接入层面的基准线,使用层面的区隔化特征方能得以显现。值得关注的是,接入时长作为时间维度变量,对使用模式具有显著解释力。因此,“网龄”(internet age)这一指标常被用以表征第一级数字鸿沟,因其不仅可测量接入状态,更能通过历时性数据反映个体网络经验的累积效应。
针对第二级数字鸿沟的概念模糊性,“互联网使用”实则包含双重意涵:其一,网络使用需要特定技能支撑,技能越精进者通常使用越活跃。若实证分析忽略数字技能变量,第二级鸿沟研究将失之偏颇。其二,网络使用不仅是技术问题,更涉及用户偏好与选择。因此考察不同网络活动的时间分配同样关键。当以网络活动为研究对象时,实证分析应优先控制数字技能变量,因其对活动类型选择具有显著影响(Hargittai& Hinnant,2008;Helsper& Eynon,2013)。
为全面把握数字鸿沟的形态,本研究构建了三级数字鸿沟的分析框架。图1以层级结构呈现了三级数字鸿沟的递进关系。该图左侧展示数字鸿沟的递进逻辑,并列举各层次的操作化测量范例;右侧则明确不同层级的研究策略:第一级鸿沟分析聚焦群体间接入差异,可通过双变量分析实现基础性描述;第二级鸿沟研究需引入回归模型,其中技能分析需控制接入变量,使用行为分析则需同时控制接入时长与技能水平;第三级鸿沟研究需构建更复杂的解释模型,在控制前两个层级变量基础上,重点考察社会经济地位群体与网络使用活动的主效应及二者的交互作用。
图1. 三层级数字鸿沟分析框架
数据来源、变量设置与统计模型
1、数据来源
本研究数据来源于中国综合社会调查(Chinese General Social Survey,CGSS)。互联网使用相关题项自2005年(CGSS2005)首度引入,其中2005、2010-2013、2015、2017-2018及2021年共9期数据包含本研究所需变量。具体数据应用策略如下:首先,整合CGSS2005-2021年多期数据构建历时性分析模型,系统考察不同教育群体互联网接入的演进轨迹,即一级数字鸿沟的时空特征;其次,选用CGSS2017年数据分析第二、三级数字鸿沟的特征。该年度调查特别设置互联网使用独立模块,通过分层随机抽样对4219名受访者进行专项测量。数据显示,互联网接入率为57.60%(N=2430),与总样本接入率(57.56%)高度吻合。经过列删法(listwise deletion)处理后,2430名受访者中的1842人构成最终分析样本。
2、变量设置
(1)受教育程度
本研究将受教育程度作为个体社会经济地位的核心测量指标,系统考察其与数字不平等现象的互构关系。在操作化定义上,为确保教育水平测量的准确性,分析样本限定为已完成教育阶段的受访者,并依据最高学历划分为三个层级:初中及以下学历、高中(含中等职业教育)学历、大学专科及以上学历。
(2)第一级数字鸿沟:互联网接入
互联网接入作为第一级数字鸿沟的关键变量,其测量方案根据调查年份差异进行适应性调整:在CGSS2005中,通过“日常生活中的上网频率”题项进行测度,将选择“几乎每天”至“一年数次”的受访者编码为“已接入”,“从不”者编码为“未接入”;在CGSS2010-2021期间,则采用“过去一年互联网(含移动互联网)使用频率”题项,除“从未使用”编码为“未接入”外,其余选项均视为“已接入”。特别需要说明的是,CGSS2017数据增设“首次使用互联网时间”题项,该指标不仅可以用于构建“网龄”变量,更可以通过历时性维度解析接入群体内部的经验异质性。
(3)第二级数字鸿沟:数字技能与在线行为
本研究依据Scheerder等人(2017)提出的三维度理论框架,将数字技能解构为媒介操作技能(medium-related)、内容生产技能(content-related)与安全防护技能(safety and security),并通过主成分分析法(principal component analysis)合成“综合数字技能指数”(general skills)。具体操作化路径如下:在CGSS2017调查中,通过六项情境式量表测量数字技能——询问是否会(1)打开网站;(2)下载安装APP;(3)查找信息;(4)验证网络信息;(5)操作表达想法;(6)确认网络支付环境安全。其中,前两项表征媒介操作能力,中间三项测量内容生产能力,最后一项反映网络安全防护能力。受访者采用李克特五级量表自评技能水平(1=非常符合,5=非常不符合),经反向编码后划分为两类:1-3分为“非熟练”,4-5分为“熟练”。该量表具信度水平很高(Cronbach's α=0.90),通过主成分分析生成的标准化综合指数(取值范围为0-1)作为控制变量,用于在线活动参与度与三级鸿沟效益的预测模型。
在线活动类型作为第二级数字鸿沟的另一核心指标,其测量依据Büchi等(2016)的四领域分类法。CGSS2017调查设定了六类网络行为:(1)社交活动(如:通过Email、QQ、微信、Skype等与人交流);(2)自我展示(如:将微信朋友圈、QQ 空间、微博等作为自我展示的平台,记录与分享自己的心情);(3)网络行动(如:通过网络维护自己权益,或为他人伸张正义);(4)休闲娱乐(如:游戏、音乐、视频等);(4)休闲娱乐(如:游戏、音乐、视频等);(5)获取信息(如:搜索信息、浏览新闻等);(6)商务交易(如:网上转账、支付、网购等)。每类行为频率通过五级量表(1=从不,5=总是)测量,经重编码划分为两类:1-3分为“低参与”,4-5分为“高参与”。
(4)第三级数字鸿沟:互联网使用收益
本研究构建了包含正向与负向结果的双维度测量框架,共考察五类网络使用效应。正向结果测量聚焦经济回报与社会联结度(social connectedness):经济回报以受访者年收入为代理变量,通过引入常数项(c=1)进行对数转换以消除零值干扰;社会联结度则通过“工作日人际互动频次”指标表征,鉴于原始分布存在偏态特征,亦采用对数形式处理。
负向结果测量体系包含三个复合指标:(1)网络成瘾倾向(internet addiction):基于三项李克特量表——“和以前相比,我上网的时间越来越长了”“当我感觉心情不好时,我就上网,这样我会感觉好一些”“我上网的时间常常比计划的时间更长”;(2)生活功能受损:涵盖六项指标——“因为上网,我的日常生活受到了影响”“因为上网,我的工作受到了影响”“因为上网,我和周围的人变得更疏远了”“家人抱怨我花了太多时间在网上”“如果有一段时间不上网,我就会坐立不安”及“因为上网,我外出活动的时间越来越少了”;(3)健康风险:包括“因为上网,我的视力变差了”与“因为上网,我的肩膀和颈椎都痛”两项躯体化症状。各负向结果变量均通过主成分分析法生成标准化指数,取值区间为0-1。
(5)控制变量
既有研究表明,互联网使用模式与社会人口学属性(性别、年龄、居住区位、地理区域等)存在系统性关联。本研究在实证分析中控制上述变量,以确保模型估计的有效性。各变量的描述性统计结果详列于论文附录表A2:其中包括连续型变量(如收入、社交频次)的均值、标准差、最小值与最大值,分类变量及虚拟变量(如受教育程度、网络接入状态)的类别百分比。
3、统计模型与分析策略
实证分析结果
1、第一级数字鸿沟:接入沟的历时性演化
图2通过双重图示揭示了中国互联网接入的群体分化特征。主图显示,全民互联网接入率从2005年的17.40%攀升至2021年的71.85%,呈现指数级高速增长态势。分学历群体的子图则显示,第一级数字鸿沟呈现“扩张-收敛”的演化特征:2005-2010年间,高中及以上学历群体的接入率快速提升,而初中及以下学历群体增速滞后,导致一级数字鸿沟的阶段性扩张(差距峰值达70个百分点);2015年后,随着新型基础设施建设的推进,学历分层引致的接入差距逐步收敛,至2021年缩减至约40个百分点。
图2. 2005-2021年中国所有人群(左)和不同学历人群(右)上网比例。
注:误差条(Error Bars)表示在95%置信水平下的置信区间。
数据来源:CGSS2005、2010、2011、2012、2013、2015、2017、2018和2021年。
值得警惕的是,尽管第一级数字鸿沟近十年呈现显著收敛趋势,学历维度的接入差异仍维持显著的结构性差距。2021年数据显示,大专及以上学历群体的互联网普及率接近饱和(98.2%),而初中及以下学历群体仍存在40%以上的未触网人口。这种沿袭既有社会经济差异的结构性数字排斥,构成当代中国数字治理的核心挑战。
2、第二级数字鸿沟:互联网使用的学历差异
互联网接入的效益并非自然生成,其实际效能需通过使用层面的差异得以实现。本研究基于CGSS2017数据,从数字技能与在线活动双维度解构第二级数字鸿沟的生成机制。图3通过分组回归分析揭示了技能的学历分化:在控制年龄、性别、居住地区等变量后(图3A),高中及以上学历群体在六项数字技能上均显著优于初中及以下学历群体(参照组)。引入“网龄”变量后(图3B),高中及以上学历群体的技能优势在五项指标中仍具统计显著性,而大专及以上学历群体在所有技能维度持续保持显著优势。这表明,网络使用经验虽能部分解释技能差异,但学历分层产生的数字鸿沟具有超越接入差异的独立效应。
图3. 不同学历群体在数字技能方面的差距。
面板A模型估计中未加入“网龄”变量。
面板B模型估计中包含“网龄”变量。
注:估计系数和95%置信水平下的置信区间来自回归模型(完整结果见附录B表B1和B2)。
“初中及以下学历”作为参照组,用虚线表示。每个模型都对受访者的年龄、年龄平方、性别、居住地和地理区域等变量进行了控制。
数据来源:CGSS2017,N=1842。
图4通过三组Logistic回归模型解析在线活动的学历分化机制。基准模型(图4A)显示,相较于参照组,高学历群体在五类活动中均呈现出更高的参与度,尤以信息获取与商务交易最为显著。引入“网龄”变量后(图4B),高中学历群体与初中及以下学历群体的活动差异大幅度缩小,而大专及以上学历群体仍保持信息获取与商务交易的显著优势。进一步控制数字技能后(图4C),高中学历群体仅在信息获取维度存留微弱优势,而大专及以上学历群体在信息获取、商务交易及社交互动三个维度继续保持显著。
图4. 不同学历群体在参与不同在线活动方面的差异。
面板A中,模型估计控制了受访者的年龄、年龄平方、性别、居住地和地理区域等变量。
面板B中,模型估计还加入了“网龄”变量。
面板C中,模型估计还包括“综合数字技能指数”变量。
注:估计系数和95%置信水平下的置信区间来自回归模型。(完整结果见附录B表B3-B5)。
初中及以下学历组作为参照组,用虚线表示。
数据来源:CGSS2017,N=1842。
研究发现,高学历群体不仅数字技能维度上占优,更在资本增值型活动(信息获取、商务交易)中表现突出。但值得注意的是,中国高学历群体虽在数字技能和资本增值型活动参与上占优,但其网络行为模式呈现复合特征——既保持资本增值型活动优势,又未显著减少社交娱乐的投入。这些发现揭示了当代中国网络活动差异的复杂图景——在线活动参与差异与数字技能分化共同构成了第二级数字鸿沟的基本形态。
3、第三级数字鸿沟:数字收益的分化
为更全面地把握数字不平等现象,本研究将突破前两级数字鸿沟的局限聚焦“谁能从互联网使用中获益更多”这一核心命题。图5所示的交互效应分析结果揭示了三级数字鸿沟的复杂图景。
图5. 不同在线活动对不同学历群体两类积极结果和三类消极结果的影响。
面板A,年收入回报;面板B,社会联系;面板C,网络成瘾;面板D,对日常生活的不良影响;面板E,健康问题。
注:本图中的估计系数和95%置信水平下的置信区间来自带交互项的回归模型。每个回归模型都控制了“网龄”“综合数字技能指数”以及基本的人口学和社会经济特征变量。
数据来源:CGSS2017,N=1842。
经济回报维度(图5A)呈现显著补偿效应:初中及以下学历群体通过在线活动获得的边际收益显著高于高学历群体,部分缩小了既有收入差距。不过,值得注意的是,高学历群体在休闲娱乐活动中的参与呈现显著的负向经济效应,暗示其网络实践面临更高机会成本。
社会联结维度(图5B)呈现类似模式:低学历群体通过社交活动与信息获取能够显著提升社会资本积累,而高学历群体的同类活动边际效应却趋近于零。总之,低学历群体能从多种网络活动中获益,而这些活动对高学历群体要么影响微弱,要么具有负面影响。
负向结果维度(图5C-E)则呈现出普遍高风险特征:无论学历分层如何,网络成瘾、生活功能受损与健康风险的效应值均无显著组间差异。唯有信息获取活动例外,其对高学历群体的健康负面效应显著高于低学历群体。
总的来说,在数字化转型进程中,不同群体从中的获益程度呈现显著差异。互联网使用对最低学历群体表现出更强的正向赋能效应,使其得以在收入水平、社会联结度等关键社会经济结果维度,缩小与较高学历群体之间的结构性差距。这一现象可通过双重作用机制予以阐释:其一,互联网技术通过提供相对均质化的信息接触路径与机会获取通道,使传统资源处于劣势的群体获得更大的边际效益;其二,低学历个体犹如网络活动——包括被视作消遣的休闲娱乐行为——的机会成本,也显著低于高学历群体。
4、小结:数字时代的新分层机制
基于上述研究发现,我们能否断言“谁受益更多”的答案是低学历群体?就边际效应而言,答案具有肯定性。但就整体效益而言,问题呈现复杂性——尽管低学历群体从网络使用中获得的边际效益更高,但其总体在线活动参与度却是最低的。因此,需将图5的边际效应与图4的在线活动参与度结合起来分析:如图4所示,低学历群体在信息获取与商务交易等资本增值型活动的参与度显著落后,而此类活动恰是缩小收入与社会联结度差距的核心(图5A-B)。这种“高收益-低参与”的悖论意味着,低学历群体在最具效益潜力的数字实践中处于系统性弱势。
由此,触及本文的第二个核心问题:在数字时代的社会分层重构中,哪些群体处于最弱势地位?图6A组通过学历水平(高/低)与网络参与强度(高/低)的双维框架构建四组分析模型:第1组“低学历-低参与”(如欠发达农村农业从业者);第2组“低学历-高参与”(如中等学历水平的电商从业者);第3组“高学历-低参与”(如中产阶层老年群体);第4组“高学历-高参与”(如软件工程师等技术精英)。图6B组的预测收入显示,第2组通过资本增值型活动使其收入逼近甚至超越第3组,表明通过互联网开展资本增值型活动具备缓解传统不平等的潜力。但第1组作为传统人力资本与资本增值型活动参与的“双重弱势群体”,其收入水平显著滞后于其他各组,在数字时代可能面临更严重的边缘化风险。
图6. 数字时代的分层机制。
面板A,根据学历水平和数字使用情况划分的四组人群。
面板B,根据学历水平和互联网使用情况预测的收入。
注:“低参与度”(Low engagement,频率=1)和“高参与度”(High engagement,频率=5)均表示互联网使用状况。
数据来源:CGSS2017,n=1842。
稳健性检验与进一步分析
为确保研究结论的稳健性,本研究实施了三组补充性分析。首先,针对三级数字鸿沟的OLS回归模型进行双重修正:(1)在原有模型基础上引入其他五类在线活动的使用频率变量,以控制其他网络活动对核心解释变量的潜在影响;(2)将特定活动类型变量替换为周均上网总时长指标(涵盖问卷未列明的其他活动耗时)。在控制其他活动频率或引入总时长变量后,基准模型的核心发现保持稳健,关键变量的系数方向与显著性水平也未发生本质变化。
其次,鉴于职业属性可能对数字技能、在线活动参与及使用效益产生混杂效应,我们在第二、第三级数字鸿沟模型中新增职业类型控制变量。结果显示,职业变量的引入并未改变学历分层与数字技能的核心作用路径,证实主模型结论具有跨职业群体的普适性。
最后,实施代际比较分析。将样本划分为青年群体(18-35岁)与中年群体(36-60岁)进行分组回归估计:图D1显示,青年群体内部不同学历群体的技能差异显著小于中年群体,反映代际数字素养的收敛趋势;但图D2表明,两组群体的网络活动参与差异仍具显著性。图D3的预测收入分布揭示代际分化机制:青年群体中,高参与度的低学历组(第2组)收入不仅超越低参与度高学历组,且逼近高学历高参与组;而中年群体仍维持学历水平的主导效应。
结论与讨论
既有的数字不平等研究因概念界定模糊、测量工具异质与分析策略分歧,在数字使用差异及其社会后果方面难以形成共识。为突破这一研究瓶颈,本研究建构数字鸿沟研究的量化分析框架,基于中国综合社会调查(CGSS)2005-2021年数据,系统考察了中国数字鸿沟的演变规律及其与传统分层机制的交互作用。
研究发现可归纳为三个核心结论:第一,第一级数字鸿沟呈现“扩张-收敛”的历时性特征。在数字化转型初期(2005-2010年),不同学历群体数字接入差距持续扩大(差距峰值达72个百分点),但从2010年以后显著收敛(2021年缩减至40个百分点)。当前中国互联网普及率虽超70%,低学历者等弱势群体的互联网接入率仍显著偏低。第二,第二级数字鸿沟表现为技能与行为的双重分化。在控制数字接入变量后,高学历群体数字技能优势依然显著,且在信息获取与商务交易等资本增值型活动中参与度更高。第三,第三级数字鸿沟呈现边际收益与整体收益的悖论。低学历群体网络参与的边际收益更高,但其资本增值型活动参与度最低,导致整体收益仍处劣势。
就数字技术与社会不平等的关系而言,研究发现揭示了双重可能性:一方面,数字技术为弱势群体提供跨越传统分层的机会。实证数据显示,积极参与资本增值型活动的低学历群体(如电商从业者)收入可以追赶甚至超越低参与的高学历群体(如中产退休人员)。另一方面,人力资本与数字能力的双重匮乏可能加剧边缘化风险。典型代表为低学历-低参与群体(如传统农民),其收入水平显著低于其他各组,面临数字时代的双重劣势。
本研究在三个方面推进了现有文献的发展:其一,建构三级数字鸿沟的实证分析框架,为实证研究提供可操作化方案;其二,揭示中国数字不平等近二十年的演进规律,夯实经验研究基础;其三,阐释数字分层与传统分层机制的交互作用,深化了对数字时代社会分层格局的认识。
本文转自 | Sociology理论志返回搜狐,查看更多