عنوان مقاله:

کنترل یکپارچه ترافیک برای گلوگاه مکرر آزادراه بر اساس یادگیری تقویتی عمیق

Integrated Traffic Control for Freeway Recurrent Bottleneck Based on Deep Reinforcement Learning

سال انتشار: 2022

رشته: مهندسی عمران - مهندسی کامپیوتر

گرایش: هوش مصنوعی - سازه - مهندسی الگوریتم و محاسبات

دانلود رایگان این مقاله:

دانلود مقاله کنترل یکپارچه ترافیک

مشاهده سایر مقالات جدید:

 

مقالات ISI مهندسی عمران

 

مقالات ISI مهندسی کامپیوتر

\V. DEEP REINFORCEMENT LEARNING MODEL

In this section, the details of the integrated control system are proposed. We first build the study scenarios and then define our DRL model’s three essential elements: states, actions, and rewards. The improved deep actor-critic algorithms are in the next section

A. The Study Scenes of the Control System

This study aims to evaluate deep reinforcement learning algorithms in integration traffic control. To test control performance, we select two scenarios with ramp weaving sections. The open-source software Simulation of Urban Mobility (SUMO) [39] is chosen for the experiments. SUMO can perfectly simulate different freeway traffic scenes and various control strategies with the Traffic Control Interface package. We made the simulation environment as accurate as possible to evaluate the DRL models.

1) The Single Bottleneck Scene: A 2km freeway with on and off-ramps near Drechttunnel, Netherlands, is selected as the single bottleneck scene, as shown in Fig. 4. The road network is divided into segments, with 200 meters each. The control system has one RM controller and two continuously placed VSL controllers. The traveling traffic has three routes: the mainline to mainline (M2M) traffic, the mainline to offramp (M2Off) traffic, and the on-ramp to mainline (On2M) traffic. Krauss model [40] is used as the microscopic model for the simulation, which guarantees safe driving. There are two types of vehicles: 90% of cars and 10% of trucks. The length of a car is 4 meters, while the length of a truck is 8 meters. One simulation episode takes two hours to cover the entire rush hour period. The traffic demands of the three routes are in Table III.

(دقت کنید که این بخش از متن، با استفاده از گوگل ترنسلیت ترجمه شده و توسط مترجمین سایت ای ترجمه، ترجمه نشده است و صرفا جهت آشنایی شما با متن میباشد.)

\ V. مدل یادگیری تقویتی عمیق

در این بخش جزئیات سیستم کنترل یکپارچه ارائه شده است. ما ابتدا سناریوهای مطالعه را می سازیم و سپس سه عنصر اساسی مدل DRL خود را تعریف می کنیم: حالت ها، اقدامات و پاداش ها. الگوریتم‌های عمیق بازیگر-نقد بهبود یافته در بخش بعدی هستند

الف. صحنه های مطالعه سیستم کنترل

هدف این مطالعه ارزیابی الگوریتم های یادگیری تقویتی عمیق در کنترل ترافیک یکپارچه است. برای آزمایش عملکرد کنترل، ما دو سناریو با مقاطع بافندگی رمپ را انتخاب می کنیم. نرم افزار منبع باز شبیه سازی تحرک شهری (SUMO) [39] برای آزمایش ها انتخاب شده است. SUMO می تواند صحنه های مختلف ترافیک آزادراه ها و استراتژی های کنترلی مختلف را با بسته رابط کنترل ترافیک به خوبی شبیه سازی کند. ما محیط شبیه‌سازی را تا حد امکان دقیق ساختیم تا مدل‌های DRL را ارزیابی کنیم.