星空体育app官网下载(中国)-唯一官方网站

张程伟

作者：时间：2024-10-16 点击数：

张程伟 副教授 博士生导师

软件工程系，计算机科学与技术

毕业院校：天津大学

通信地址：辽宁省大连市凌海路1号

学位：博士

邮箱：chenvy@dlmu.edu.cn

主要研究方向：多智能体强化学习，交通信号控制，交通物流优化，无人机导航与控制

邮编：116026

| 教育经历

2011.09-2018.07 天津大学计算机软件与理论博士

2007.09-2011.07 西北工业大学数学与应用数学本科

| 工作经历

2018.09-2022.07 大连海事大学星空体育app官网下载讲师

2022.07-至今大连海事大学星空体育app官网下载副教授

| 讲授课程

1. 数据结构

2. 数据结构实验

3. 面向对象分析与设计

4. 深度强化学习（研究生课程）

| 研究领域

以强化学习为技术驱动的决策智能及周边应用，包括强化学习相关算法研究，及交通信号灯控制、交通物流优化、成品油调度和无人机导航与控制等应用研究

学术成果

| 近三年发表论文

[1] K. Zhou, C. Zhang, F. Zhan, W. Liu, and Y. Li, “Using a single actor to output personalized policy for different intersections,” Neural Networks, p. 108909, Mar. 2026, doi: 10.1016/j.neunet.2026.108909.

[2] Y. Zhang et al., “Rethinking the Utilization of Individual Rewards in Multiagent Reinforcement Learning With Sparse Team Rewards,” IEEE Trans. Neural Netw. Learning Syst., pp. 1–15, 2026, doi: 10.1109/TNNLS.2026.3658520.

[3] Z. Sun, D. An, H. Xi, and C. Zhang, “Physics-Informed Reinforcement Learning for electric vehicle charging scheduling,” Energy, p. 140638, Mar. 2026, doi: 10.1016/j.energy.2026.140638.

[4] Y. Song, C. Zhang, W. Liu, C. Li, and F. Zhan, “Structured Sparse Deep Reinforcement Learning for Accelerating Traffic Signal Decision-Making Under Limited Computational Resources,” IEEE Internet Things J., pp. 1–1, 2026, doi: 10.1109/JIOT.2026.3657316.

[5] Y. Li, C. Zhang, W. Liu, C. Li, D. An, and Q. Wang, “A Two-Stage Framework Based on RL for Truck–Drone Collaborative Delivery Problem,” IEEE Internet Things J., vol. 13, no. 5, pp. 8777–8788, Mar. 2026, doi: 10.1109/JIOT.2025.3641887.

[6] Y. Li, C. Zhang, F. Zhan, W. Liu, K. Zhou, and L. Zheng, “Enhancing traffic signal control through model-based reinforcement learning and policy reuse,” Expert Systems with Applications, vol. 298, p. 129755, 2026, doi: https://doi.org/10.1016/j.eswa.2025.129755.

[7] K. Tang et al., “Safe Refined Oil Dispatching via Constrained Multiagent Reinforcement Learning With Hierarchical Action Spaces,” IEEE Trans. Automat. Sci. Eng., vol. 22, pp. 23164–23176, 2025, doi: 10.1109/TASE.2025.3625392.

[8] W. Liu et al., “Sequential Decision MARL for Adaptive Traffic Signal Control With Different Intersections Priorities,” IEEE Trans. Intell. Transport. Syst., vol. 26, no. 7, pp. 9799–9811, Jul. 2025, doi: 10.1109/TITS.2025.3572097.

[9] W. Liu et al., “Vehicle-Level Fairness-Oriented Constrained Multi-Agent Reinforcement Learning for Adaptive Traffic Signal Control,” IEEE Trans. Intell. Transport. Syst., vol. 26, no. 4, pp. 4878–4890, Apr. 2025, doi: 10.1109/TITS.2025.3544223.

[10] Z. Zhang et al., “Learning Self-Corrective Network via Adaptive Self-Labeling and Dynamic NMS for High-Performance Long-Term Tracking,” IEEE Trans. Neural Netw. Learning Syst., pp. 1–12, 2023, doi: 10.1109/TNNLS.2023.3327486.

[11] C. Zhang et al., “Opinion Dynamics in Gossiper-Media Networks Based on Multiagent Reinforcement Learning,” IEEE Trans. Netw. Sci. Eng., vol. 10, no. 2, pp. 1143–1156, Mar. 2023, doi: 10.1109/TNSE.2022.3229770.

[12] Y. Tian et al., “Optimistic Exploration Based on Categorical-DQN for Cooperative Markov Games,” in Distributed Artificial Intelligence, vol. 13824, M. Yokoo, H. Qiao, Y. Vorobeychik, and J. Hao, Eds., in Lecture Notes in Computer Science, vol. 13824. , Cham: Springer Nature Switzerland, 2023, pp. 60–73. doi: 10.1007/978-3-031-25549-6_5.

| 专利成果

1. 一种基于多智能体强化学习的自适应交通信号控制方法.专利号： CN202011092990.8，授权日期：2021-07

2. 一种基于 Categorical-DQN 乐观探索的交通控制方法. 专利号： CN202110649807.8，授权日期：2022-03

3. 基于多智能体强化学习的异构路口场景交通信号控制方法. 专利号: CN202111402414.3，授权日期：2022-10

4. 基于邻居感知的多智能体强化学习的交通信号控制方法.专利号: CN 202110649830.7，授权日期：2022-10

5. 一种基于强化学习的实时竞价广告资源分配方法.专利号: CN202011062131.4，授权日期：2024-02

6. 面向公平自适应交通信号控制的多智能体强化学习方法. 专利号：CN202310821696.3, 授权日期：2026-02

| 主持科研项目

1. 国家自然科学基金面上项目，聚焦交通信号控制决策智能落地难点的深度强化学习关键技术研究, 49万，主持，2024-2027

2. 国家自然科学基金青年项目，基于多智能体强化学习的大规模协作关键技术研究完成，25万，主持， 2020-2023

3. 中国博士后基金面上项目，大规模智能体协作问题的强化学习技术及应用研究，8万，主持，2020-2022

4. 山东省自然科学基金智慧计算联合基金子课题，面向复杂交互场景的智能体自主决策方法研究，29万，主持，2023-2025

5. 装备预研教育部联合基金（青年人才）子课题，动态复杂环境下的多智能体表征学习与决策方法研究，10万，主持，2024-2025

6. 沈自所委托军口项目，水面无人艇集群协同决策技术研究技术服务协议，10.5万，主持，2025-2026

|主要荣誉

1. 校级优秀硕士毕业学位论文，大连海事大学，2025

2. 校级优秀研究生导师，大连海事大学，2023

| 招生信息

	专业代码	招生专业	研究方向
硕士生招生信息	081200，085404，085405，085410，085411	计算机科学与技术，计算机技术（专业学位），软件工程（专业学位），人工智能（专业学位），大数据技术与工程（专业学位）	基于强化学习的相关应用问题，如交通信号灯优化控制、交通物流优化、成品油调度以及无人机导航与决策问题。
博士生招生信息	081200	计算机科学与技术	深度强化学习、多智能体强化学习及周边应用

持续招生中：

27年学术博士名额尚有1名，目前缺一个想读博的苗子；

常年招专业博士，交通物流、成品油调度以及机器人方向，有一定工程能力者优先。

硕士、博士生招生要求：1.主观能动性强，有集体荣誉感；2.身心健康、积极乐观；3.数学基础好、英语过六级；4.有志于读博者优先。

对人格上的期望：希望师门内部能够团结有爱。在团队内部形成大事讲原则、小事讲风格的风气，同门之间要胸怀坦荡、以诚相待，科研上互相支持，生活上互相帮助，心理上互相理解，既是同门又是朋友，不计较个人得失，不争你高我低。要多看别人的长处，多想自己的不足，要有容人之量和爱人之心，真正形成团结和谐的工作环境。毕业以后师门将是互相的依靠。

对学术上的期望：希望学生有志于从事学术研究（国内或国外大学及科研机构）、技术研发（科技公司）等工作。期望学生们毕业之后都能同时具备3个方面较强的素质：i）具有优良的做人做事习惯，认真负责、积极向上、刻苦努力；ii) 具备批判性思维能力，硕士生能够独立分析问题和解决问题，博士生能独立完成科研任务并独立撰写高水平学术论文；iii) 有好的学术品味，做有用的研究，立志于让研究成果在重要的产业实践中发挥作用。

推荐的学习资料：

吴恩达-动手学深度学习

清华大学王树森-深度强化学习

西湖大学赵世钰-强化学习的数学原理

本团队github地址：https://github.com/RL-DLMU

本团队学堂在线线上课程：深度强化学习https://www.xuetangx.com/course/dlmuP08121016957/29607157?channel=i.area.learn_title

“我们的同志在困难的时候，要看到成绩，要看到光明，要提高我们的勇气” ---毛主席

地址: 大连海事大学电航楼.