张程伟

作者: 时间:2024-10-16 点击数:

张程伟 副教授 博士生导师


软件工程系,计算机科学与技术

毕业院校:天津大学

通信地址:辽宁省大连市凌海路1号

学位:博士

邮箱:chenvy@dlmu.edu.cn

主要研究方向:多智能体强化学习交通信号控制交通物流优化无人机导航与控制

邮编:116026


| 教育经历

2011.09-2018.07 天津大学 计算机软件与理论 博士

2007.09-2011.07  西北工业大学 数学与应用数学 本科

| 工作经历

2018.09-2022.07 大连海事大学 星空体育app官网下载 讲师

2022.07-至今  大连海事大学 星空体育app官网下载 副教授

| 讲授课程

1. 数据结构

2. 数据结构实验

3. 面向对象分析与设计

4. 深度强化学习(研究生课程)

| 研究领域

以强化学习为技术驱动的决策智能及周边应用,包括强化学习相关算法研究,及交通信号灯控制、交通物流优化、成品油调度和无人机导航与控制等应用研究

学术成果

| 近三年发表论文

[1] K. Zhou, C. Zhang, F. Zhan, W. Liu, and Y. Li, “Using a single actor to output personalized policy for different intersections,” Neural Networks, p. 108909, Mar. 2026, doi: 10.1016/j.neunet.2026.108909.

[2] Y. Zhang et al., “Rethinking the Utilization of Individual Rewards in Multiagent Reinforcement Learning With Sparse Team Rewards,” IEEE Trans. Neural Netw. Learning Syst., pp. 1–15, 2026, doi: 10.1109/TNNLS.2026.3658520.

[3] Z. Sun, D. An, H. Xi, and C. Zhang, “Physics-Informed Reinforcement Learning for electric vehicle charging scheduling,” Energy, p. 140638, Mar. 2026, doi: 10.1016/j.energy.2026.140638.

[4] Y. Song, C. Zhang, W. Liu, C. Li, and F. Zhan, “Structured Sparse Deep Reinforcement Learning for Accelerating Traffic Signal Decision-Making Under Limited Computational Resources,” IEEE Internet Things J., pp. 1–1, 2026, doi: 10.1109/JIOT.2026.3657316.

[5] Y. Li, C. Zhang, W. Liu, C. Li, D. An, and Q. Wang, “A Two-Stage Framework Based on RL for Truck–Drone Collaborative Delivery Problem,” IEEE Internet Things J., vol. 13, no. 5, pp. 8777–8788, Mar. 2026, doi: 10.1109/JIOT.2025.3641887.

[6] Y. Li, C. Zhang, F. Zhan, W. Liu, K. Zhou, and L. Zheng, “Enhancing traffic signal control through model-based reinforcement learning and policy reuse,” Expert Systems with Applications, vol. 298, p. 129755, 2026, doi: https://doi.org/10.1016/j.eswa.2025.129755.

[7] K. Tang et al., “Safe Refined Oil Dispatching via Constrained Multiagent Reinforcement Learning With Hierarchical Action Spaces,” IEEE Trans. Automat. Sci. Eng., vol. 22, pp. 23164–23176, 2025, doi: 10.1109/TASE.2025.3625392.

[8] W. Liu et al., “Sequential Decision MARL for Adaptive Traffic Signal Control With Different Intersections Priorities,” IEEE Trans. Intell. Transport. Syst., vol. 26, no. 7, pp. 9799–9811, Jul. 2025, doi: 10.1109/TITS.2025.3572097.

[9] W. Liu et al., “Vehicle-Level Fairness-Oriented Constrained Multi-Agent Reinforcement Learning for Adaptive Traffic Signal Control,” IEEE Trans. Intell. Transport. Syst., vol. 26, no. 4, pp. 4878–4890, Apr. 2025, doi: 10.1109/TITS.2025.3544223.

[10] Z. Zhang et al., “Learning Self-Corrective Network via Adaptive Self-Labeling and Dynamic NMS for High-Performance Long-Term Tracking,” IEEE Trans. Neural Netw. Learning Syst., pp. 1–12, 2023, doi: 10.1109/TNNLS.2023.3327486.

[11] C. Zhang et al., “Opinion Dynamics in Gossiper-Media Networks Based on Multiagent Reinforcement Learning,” IEEE Trans. Netw. Sci. Eng., vol. 10, no. 2, pp. 1143–1156, Mar. 2023, doi: 10.1109/TNSE.2022.3229770.

[12] Y. Tian et al., “Optimistic Exploration Based on Categorical-DQN for Cooperative Markov Games,” in Distributed Artificial Intelligence, vol. 13824, M. Yokoo, H. Qiao, Y. Vorobeychik, and J. Hao, Eds., in Lecture Notes in Computer Science, vol. 13824. , Cham: Springer Nature Switzerland, 2023, pp. 60–73. doi: 10.1007/978-3-031-25549-6_5.

| 专利成果

1. 一种基于多智能体强化学习的自适应交通信号控制方法.专利号: CN202011092990.8 授权日期:2021-07

2. 一种基于 Categorical-DQN 乐观探索的交通控制方法. 专利号: CN202110649807.8 授权日期:2022-03

3. 基于多智能体强化学习的异构路口场景交通信号控制方法. 专利号: CN202111402414.3 授权日期:2022-10

4. 基于邻居感知的多智能体强化学习的交通信号控制方法.专利号: CN 202110649830.7,授权日期:2022-10

5. 一种基于强化学习的实时竞价广告资源分配方法.专利号: CN202011062131.4,授权日期:2024-02

6. 面向公平自适应交通信号控制的多智能体强化学习方法. 专利号:CN202310821696.3, 授权日期:2026-02

| 主持科研项目

1. 国家自然科学基金面上项目聚焦交通信号控制决策智能落地难点的深度强化学习关键技术研究, 49万,主持,2024-2027

2. 国家自然科学基金青年项目基于多智能体强化学习的大规模协作关键技术研究完成25万,主持, 2020-2023

3. 中国博士后基金面上项目大规模智能体协作问题的强化学习技术及应用研究,8万,主持,2020-2022

4. 山东省自然科学基金智慧计算联合基金子课题面向复杂交互场景的智能体自主决策方法研究29万,主持,2023-2025

5. 装备预研教育部联合基金(青年人才)子课题,动态复杂环境下的多智能体表征学习与决策方法研究,10万,主持,2024-2025

6. 沈自所委托军口项目,水面无人艇集群协同决策技术研究技术服务协议10.5万,主持2025-2026

|主要荣誉

1. 校级优秀硕士毕业学位论文,大连海事大学,2025

2. 校级优秀研究生导师,大连海事大学,2023

| 招生信息


专业代码

招生专业

研究方向

硕士生招生信息

081200,085404,085405,085410,085411

计算机科学与技术,计算机技术 (专业学位),软件工程(专业学位),人工智能(专业学位),大数据技术与工程 (专业学位)

基于强化学习的相关应用问题,如交通信号灯优化控制、交通物流优化、成品油调度以及无人机导航与决策问题。

博士生招生信息

081200

计算机科学与技术

深度强化学习、多智能体强化学习及周边应用

持续招生中:

27年学术博士名额尚有1名,目前缺一个想读博的苗子;

常年招专业博士,交通物流、成品油调度以及机器人方向,有一定工程能力者优先。

硕士、博士生招生要求:1.主观能动性强,有集体荣誉感;2.身心健康、积极乐观;3.数学基础好、英语过六级;4.有志于读博者优先。

对人格上的期望:希望师门内部能够团结有爱。在团队内部形成大事讲原则、小事讲风格的风气,同门之间要胸怀坦荡、以诚相待,科研上互相支持,生活上互相帮助,心理上互相理解,既是同门又是朋友,不计较个人得失,不争你高我低要多看别人的长处,多想自己的不足,要有容人之量和爱人之心,真正形成团结和谐的工作环境。毕业以后师门将是互相的依靠。

对学术上的期望:希望学生有志于从事学术研究(国内或国外大学及科研机构)、技术研发(科技公司)等工作。期望学生们毕业之后都能同时具备3个方面较强的素质:i)具有优良的做人做事习惯,认真负责、积极向上、刻苦努力;ii) 具备批判性思维能力,硕士生能够独立分析问题和解决问题,博士生能独立完成科研任务并独立撰写高水平学术论文iii) 有好的学术品味,做有用的研究,立志于让研究成果在重要的产业实践中发挥作用。

推荐的学习资料:

吴恩达-动手学深度学习

清华大学王树森-深度强化学习

西湖大学赵世钰-强化学习的数学原理

本团队github地址:https://github.com/RL-DLMU

本团队学堂在线线上课程:深度强化学习https://www.xuetangx.com/course/dlmuP08121016957/29607157?channel=i.area.learn_title


我们的同志在困难的时候,要看到成绩,要看到光明,要提高我们的勇气 ---毛主席


版权所有:星空体育app官网下载(中国)-唯一官方网站

地址: 大连海事大学电航楼.