同济大学Magic Lab博士研究生杨佳琪的最新研究“DFF: Decision-Focused Fine-tuning for Smarter Predict-then-Optimize with Limited Data”近日被人工智能领域顶级国际会议AAAI 2025收录。杨佳琪同学受邀出席了本次AAAI会议,并进行了口头报告与海报展示。本研究是苏子诚研究员主持的滴滴盖亚合作项目“网约车场景下的资源统筹规划与智能决策问题”的阶段性成果,并获得香港城市大学研究助理教授梁恩明博士、安琨教授以及滴滴出行网约车MPT团队多位算法专家的深入指导。

AAAI是由国际人工智能促进协会主办的年会,是人工智能领域中历史最悠久、涵盖内容最广泛的国际顶级学术会议之一,也是中国计算机学会(CCF)推荐的A类国际学术会议。第39届AAAI于2025年2月25日至3月4日在美国费城举办。本届会议共收到有效投稿12957篇,其中3032篇论文被录用,录用率为23.4%。同时,该成果成功入选了AAAI大会的Oral Presentation(口头报告,共600篇论文入选),入选率为4.6%。

本研究聚焦于对Decision-focused Learning(DFL)方法的改进与创新。DFL通过对决策损失的梯度回传,为传统预测-优化(Predict-then-Optimize, PO)两阶段框架提供了一种端到端的方法,提高了PO系统的决策性能。然而,现有决策损失函数在有限数据下不易收敛,易使预测结果偏离原有物理意义,且无法应用于不可微的预测模型。为了解决上述挑战,本研究论文创新性地提出了一种微调框架(Decision-focused Fine-tuning, DFF),该框架通过设计一种偏差校正模块,将DFL模块无缝嵌入已有的PO范式中。同时,DFF被表述为一个约束优化问题,使预测模型的输出结果始终保持在预定义的信任区域内。论文所提出的方法在生成数据和滴滴出行的真实数据上进行了广泛的测试,结果表明DFF不仅提高了决策性能,而且严格满足微调约束,在多场景中具有良好的适应性。
