数字经济时代,数据已成为新时代的“石油”,正发挥着巨大的社会价值和经济价值,已成为世界各国高度重视的新兴战略领域。国家数据局的正式挂牌,正体现了国家在政策层面对大数据及其开发应用的高度重视。
数据价值的实现关键在于分析,统计学则被认为是大数据分析背后的支撑学科。因为数据通常包含大量杂乱而不完整的信息,统计学则能提供有效的技术清洗和预处理数据方法,使经过分析后的数据变得更加结构化和准确可靠。
统计学在社会科学中具有重要的应用价值。通过采集、整理、聚合归纳各种数据,统计学给田野调查、人口普查、经济普查、民意调查、指标体系编制等一系列社会科学活动提供帮助,最终形成全面而系统的数据资源。而通过描述性统计方法,统计学能对数据进行整理、分类、聚合,并通过图表、图像等形式展示数据的分布、趋势和相关性,使原本复杂的数据变得更加易于理解和解释。
统计学在日常生活的方方面面都有广泛的应用:在研究人口变化趋势、进行民意调查、社会调查,以及开展心理学研究时,统计学可以帮助研究人员设计合理的问卷调查、抽样方法和数据分析技术,以获取具有代表性的数据样本和得到科学合理的统计结论;在经济领域更可用大数据分析技术研究国民经济数据运行情况、开展市场问卷调查,以及投资决策预测等;在工程领域,统计学能基于质量控制、可靠性分析、实验设计等,帮助工程师设计合理的实验方案、制定可靠性测试标准和质量控制程序,确保产品质量和系统可靠。
对于各行各业不断产生且需要整理和分析的海量数据,统计学所提供的数据分析和处理方法,可以帮助人们从数据中发现规律、关联和变化趋势,并借助样本对总体进行有效推断,最终为决策和预测提供重要依据。同时,通过对数据的解释和解读,统计学还可帮助人们理解数据背后的含义和实际意义。此外,统计学家还可以从不同角度解读数据,揭示数据背后的相关关系和因果关系,为政策制定和决策提供理论依据,以达到仁者见仁、智者见智之目的。
在进一步促进数据共享和传播方面,统计学的作用也不可小觑。通过发布统计年鉴、统计报告、统计研究论文等,统计学能将数据及其分析结果传达给政府、企业、学界和社会公众,促进知识的共享和应用;统计学甚至可以监督数据的收集过程,确保数据的及时性、准确性、完整性、代表性和真实可靠性,也可通过数据治理和数据分析研判决策、政策的合理性。
大数据时代已然到来。作为数据分析背后的支撑学科,统计学将在大数据分析与人工智能领域发挥越来越重要的作用,社会也将愈加关注大规模数据的分析、处理和解释,以及数据的可视化展示以进行数据探索性分析。而这意味着,统计学将会与数据科学、机器学习等深度交叉,并发展出新的统计模型和学习方法,处理更大规模的海量数据集,为解决现实世界中的复杂问题提供更加有效的统计方法和数据分析工具。
(第一作者系云南大学数学与统计学院教授,第二作者系云南大学数学与统计学院讲师)