大数据情境下的数据完备化:挑战与对策
陈松蹊 毛晓军 王聪
北京大学光华管理学院 北京大学统计科学中心 上海交通大学数学科学学院
随着数字经济时代的到来,数据作为一种重要的生产要素,深刻改变了管理决策范式。对具有超规模、跨领域、流信息的大数据的分析利用成为了赋能管理实践的重要因素,其中数据的质量与完备性是影响后续数据价值提炼的重要前提。然而受限于数据采集方式与过程、被采集主体行为模式特点等因素,数据常常呈现超高缺失率的特点。超高数据缺失会严重影响数据分析及所承载的管理决策效果。因而,预先对大数据进行有效完备化对保证后续分析决策效果具有重要意义。本文对大数据情境下的数据完备化问题进行了系统梳理,重点给出在超高维度、多源异构、时空关联的情境下的大数据完备化问题的主要挑战、求解思路及其对管理学研究的启示,以期为大数据完备化及赋能管理决策奠定理论和方法学基础。