基于深度增强学习的个性化动态促销
张诚 王富荣 郁培文 邓皓文
随着大数据技术和应用的普及,数据驱动的决策优化已成为企业科学管理的发展趋势。本文提出了一种基于深度增强学习的策略框架,整合企业领域知识解决收益管理中复杂的动态促销问题。基于一家在线生鲜零售商随机抽取的2012名匿名消费者自注册开始的长期消费行为(共计363946条消费记录),以及该零售商的历史收益管理策略数据,结合仿真方法,本文构建了增强学习环境下的个性化动态促销模型并进行检验。结果发现,本研究提出的新策略可以有效地提升企业面向市场的收益管理能力,提高企业约18%的长期收益。数据驱动的个性化促销实现了长短期促销策略的动态平衡,从而帮助企业以更低的投入和对顾客更少的干预实现更高的回报。研究结论对数智技术应用于企业收益管理优化和混合智能方法具有显著的理论和实践意义。