KR20240091474A - Ieee 802.15.4 비슬롯 csma/ca의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치 및 방법 - Google Patents
Ieee 802.15.4 비슬롯 csma/ca의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치 및 방법 Download PDFInfo
- Publication number
 - KR20240091474A KR20240091474A KR1020220174428A KR20220174428A KR20240091474A KR 20240091474 A KR20240091474 A KR 20240091474A KR 1020220174428 A KR1020220174428 A KR 1020220174428A KR 20220174428 A KR20220174428 A KR 20220174428A KR 20240091474 A KR20240091474 A KR 20240091474A
 - Authority
 - KR
 - South Korea
 - Prior art keywords
 - packet
 - value
 - ieee
 - reinforcement learning
 - learning
 - Prior art date
 - Legal status (The legal status is an assumption and is not a legal conclusion. Google has not performed a legal analysis and makes no representation as to the accuracy of the status listed.)
 - Ceased
 
Links
Classifications
- 
        
- H—ELECTRICITY
 - H04—ELECTRIC COMMUNICATION TECHNIQUE
 - H04W—WIRELESS COMMUNICATION NETWORKS
 - H04W74/00—Wireless channel access
 - H04W74/08—Non-scheduled access, e.g. ALOHA
 - H04W74/0808—Non-scheduled access, e.g. ALOHA using carrier sensing, e.g. carrier sense multiple access [CSMA]
 - H04W74/0816—Non-scheduled access, e.g. ALOHA using carrier sensing, e.g. carrier sense multiple access [CSMA] with collision avoidance
 
 - 
        
- G—PHYSICS
 - G06—COMPUTING OR CALCULATING; COUNTING
 - G06N—COMPUTING ARRANGEMENTS BASED ON SPECIFIC COMPUTATIONAL MODELS
 - G06N3/00—Computing arrangements based on biological models
 - G06N3/02—Neural networks
 - G06N3/08—Learning methods
 - G06N3/088—Non-supervised learning, e.g. competitive learning
 
 
Landscapes
- Engineering & Computer Science (AREA)
 - Theoretical Computer Science (AREA)
 - Physics & Mathematics (AREA)
 - General Health & Medical Sciences (AREA)
 - Computing Systems (AREA)
 - Biomedical Technology (AREA)
 - Biophysics (AREA)
 - Computational Linguistics (AREA)
 - Data Mining & Analysis (AREA)
 - Evolutionary Computation (AREA)
 - Life Sciences & Earth Sciences (AREA)
 - Molecular Biology (AREA)
 - Artificial Intelligence (AREA)
 - General Engineering & Computer Science (AREA)
 - General Physics & Mathematics (AREA)
 - Mathematical Physics (AREA)
 - Software Systems (AREA)
 - Health & Medical Sciences (AREA)
 - Computer Networks & Wireless Communication (AREA)
 - Signal Processing (AREA)
 - Mobile Radio Communication Systems (AREA)
 
Abstract
Description
도 2는 강화학습 모델 구성도
도 3은 macMinBE값과 경쟁 노드 수에 따른 패킷 전송률 변화 그래프
도 4는 본 발명에 따른 강화학습 기반 동적 백오프 파라미터 선택 장치의 구성도
도 5는 본 발명에 따른 강화학습 기반 동적 백오프 파라미터 선택 방법을 나타낸 플로우 차트
도 6은 경쟁 노드 수 변화에 따른 패킷전송률 그래프
도 7은 경쟁 노드 수 변화에 따른 지연시간 그래프
도 8은 본 발명에 따른 경쟁 노드수 변화에 따른 MinBE선택 비율 그래프
200. MAC 계층 모듈
300. PHY 계층 모듈
Claims (14)
-  IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택을 적어도 하나의 프로세서를 포함하는 전자 장치가,
Q-learning 모듈로 행동 값 요청하여 행동값을 수신하고, PHY 계층 모듈로 패킷 전송을 요청하고, PHY 계층 모듈과 채널 정보를 송수신하는 MAC 계층 모듈;
Q-table을 포함하고, 상태 유지, 행동 선택, 보상 관리를 수행하고 Q(s,a)값을 유지하는 Q-learning 모듈;
MAC 계층 모듈로부터 패킷의 송신요청을 받고 또 다른 패킷 수신시에 상위 계층인 MAC 계층으로 패킷을 전달하는 PHY 계층 모듈;을 포함하는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치. -  제 1 항에 있어서, MAC 계층 모듈은,
Q-learning 모듈의 행동 선택부로 행동 값 요청하여 행동값을 수신하고, MAC 계층 관리부로 패킷 전송을 요청하고, CCA를 위하여 PHY 계층 모듈의 채널 감지부와 채널 정보를 송수신하는 채널 접근부와,
채널 접근부로부터 패킷 전송 요청을 수신하여 PHY 계층 모듈의 패킷 송수신부로 패킷 전송을 요청하는 MAC 계층 관리부를 포함하는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치. -  제 1 항에 있어서, Q-learning 모듈은,
상태 유지부, 행동 선택부, 보상 관리부와의 정보 교환으로 Q(s,a)값을 유지하는 Q-table과,
MAC 계층 모듈의 채널 접근부로부터 행동 값 요청을 수신하여 상태 유지부로부터 상태값을 확인하여 Q-table을 참조하여 최대 Q(s,a)값을 가지는 행동을 반환하는 행동 선택부와,
MAC 계층 모듈에서 송신 요청한 패킷의 성공 여부 정보를 수신하여 상태를 수시로 갱신하여 유지하는 상태 유지부와,
행동 선택부와 MAC 계층의 패킷 송신 결과 정보를 참조하여 보상을 발생시키고, 이를 Q-table에 반영하여 갱신하는 보상 관리부를 포함하는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치. -  제 1 항에 있어서, PHY 계층 모듈은,
상위 계층인 MAC 계층 모듈로부터 패킷의 송신요청을 받고 또 다른 패킷 수신시에 상위 계층인 MAC 계층으로 패킷을 전달하는 패킷 송수신부와,
MAC 계층 모듈의 채널 접근부와 채널 정보를 송수신하는 채널 감지부를 포함하는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치. -  제 1 항에 있어서, Q-learning 모듈은,
TD(Temporal-Difference)모델에 기반한 Off-policy 알고리즘을 사용하고,
는 에이전트의 상태, 행동까지 반영하여 보상을 저장하고,
값은,
,
에 의해 갱신되며 이 (s,a)의 Q-Table을 통하여 보상을 최대화 할 행동을 선택하는 정책을 갖는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치. -  제 5 항에 있어서, Q-learning 모듈은,
주체(agent), 상태(state), 행동(action), 보상(reward)의 강화학습 설계의 요소를 갖고 MAC 계층의 성능 향상을 목표로 macMaxBE, macMaxCSMABackoffs, macMinBE값을 조절하고,
macMaxCSMABackoffs는 단일 패킷에 대한 채널 유휴여부 판단 기회, macMaxBE와 macMinBE는 각각 백오프 지수의 최댓값과 최소값인 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치. -  제 6 항에 있어서, 주체는 네트워크의 노드들이고,
상태는 패킷 전송률,
행동은 macMinBE값을 선택하는 것이고,
보상은 패킷 전송 후 부모노드가 성공적으로 패킷을 수신했을 때 보내는 ACK 메시지의 수신여부에 따라 달라지는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치. -  제 7 항에 있어서, 상태는,
으로 정의되고,
학습의 주체인 노드는 현재 자신의 패킷 전송률을 관찰하여 행동하고,
CSMA/CA 알고리즘이 시작될 때 BE(Backoff Exponential)값에 적용 되는 값인 macMinBE값을 선택하는 행동을 하는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치. -  제 8 항에 있어서, 행동의 선택은 Q-learning의 Q-값 배열에서 최댓값을 가지는 값이 선택되고,
Q-값 배열은 행으로 행동, 열로 상태에 대한 보상 값을 축적하고,
Q-값 테이블의 각 요소는 각 노드의 패킷 전송률에 따른 macMinBE값을 적용했을 때의 보상 값의 축적치이고,
각 노드는 현재 패킷 전송률에서 보상 값의 축적치 중 가장 높은 행동을 취하는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치. -  제 7 항에 있어서, 보상은 전송 후 ACK 메시지의 수신여부에 따라 달라지고,
전송 후 ACK수신에 성공하면
를 통해 보상을 받고, 노드가 전송에 성공한 BE값보다 큰 BE값들에 대해서는
를 통해 패널티를 가하고,
전송 후 ACK수신에 실패하면
를 통해 보상을 받고, 노드가 전송에 실패한 BE값보다 큰 BE값들에 대해서는
를 통해 보상을 주는 것이고,
S(State)는 패킷 전송률, NB는 노드가 실행한 CSMA/CA의 횟수이며, MaxNB는 최대로 실행할 수 있는 CSMA/CA 횟수이고, A(Action)는,노드가 선정한 macMinBE값이며 MaxBE는 최대로 선택할 수 있는 BE값인 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치. -  적어도 하나의 프로세서를 포함하는 전자 장치에서 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택을 위한 동작이 수행되고,
채널 접근부와 Q-learning 모듈을 통하여 minBE값이 선택되며, BE, NB, macMaxCSMABackoffs 변수를 초기화하는 단계;
채널 접근부를 통해 [0, 2BE-1]의 백오프 범위에서 무작위 시간동안 백오프 지연을 발생시키는 단계;
채널 감지부를 통해 채널 정보의 유휴함을 송수신하는 단계;
채널 유휴를 판단하여 채널이 유휴하다면, MAC계층 관리부와 패킷 송수신부를 통해 패킷을 전송하는 단계;
패킷 송수신부, MAC 계층 관리부를 통해 ACK 메시지의 수신여부를 판단하여 결과 정보를 상태 유지부로 전달하는 단계;
상태 유지부와 보상 관리부를 통해 Q-table을 업데이트하는 단계;를 포함하는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 방법. -  제 11 항에 있어서, 채널 유휴를 판단하여 채널이 유휴하지 않다면,
채널 접근부를 통해 다음 백오프 알고리즘을 진행할지에 대한 여부를 판단하는 단계를 더 포함하는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 방법. -  제 11 항에 있어서, Q-learning 모듈은,
주체(agent), 상태(state), 행동(action), 보상(reward)의 강화학습 설계의 요소를 갖고 MAC 계층의 성능 향상을 목표로 macMaxBE, macMaxCSMABackoffs, macMinBE값을 조절하고,
macMaxCSMABackoffs는 단일 패킷에 대한 채널 유휴여부 판단 기회, macMaxBE와 macMinBE는 각각 백오프 지수의 최댓값과 최소값인 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 방법. -  제 13 항에 있어서, 주체는 네트워크의 노드들이고,
상태는 패킷 전송률,
행동은 macMinBE값을 선택하는 것이고,
보상은 패킷 전송 후 부모노드가 성공적으로 패킷을 수신했을 때 보내는 ACK 메시지의 수신여부에 따라 달라지는 것을 특징으로 하는 IEEE 802.15.4 비슬롯 CSMA/CA의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 방법.
 
Priority Applications (1)
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| KR1020220174428A KR20240091474A (ko) | 2022-12-14 | 2022-12-14 | Ieee 802.15.4 비슬롯 csma/ca의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치 및 방법 | 
Applications Claiming Priority (1)
| Application Number | Priority Date | Filing Date | Title | 
|---|---|---|---|
| KR1020220174428A KR20240091474A (ko) | 2022-12-14 | 2022-12-14 | Ieee 802.15.4 비슬롯 csma/ca의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치 및 방법 | 
Publications (1)
| Publication Number | Publication Date | 
|---|---|
| KR20240091474A true KR20240091474A (ko) | 2024-06-21 | 
Family
ID=91700651
Family Applications (1)
| Application Number | Title | Priority Date | Filing Date | 
|---|---|---|---|
| KR1020220174428A Ceased KR20240091474A (ko) | 2022-12-14 | 2022-12-14 | Ieee 802.15.4 비슬롯 csma/ca의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치 및 방법 | 
Country Status (1)
| Country | Link | 
|---|---|
| KR (1) | KR20240091474A (ko) | 
Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| KR100813884B1 (ko) | 2006-10-10 | 2008-03-18 | 전자부품연구원 | 우선순위를 지원하는 확률 기반 매체 접근 방법 및 이를실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한기록 매체 | 
| KR20090022366A (ko) | 2007-08-30 | 2009-03-04 | 주식회사 케이티 | 무선 센서 네트워크에서의 백오프 시간 결정 방법 및 이를이용한 채널 접근 방법 | 
| KR102308799B1 (ko) | 2020-07-10 | 2021-10-01 | 영남대학교 산학협력단 | 사물 인터넷 네트워크 환경에서 mac 계층 충돌 학습을 기초로 전달 경로를 선택하는 방법, 이를 수행하기 위한 기록 매체 및 장치 | 
- 
        2022
        
- 2022-12-14 KR KR1020220174428A patent/KR20240091474A/ko not_active Ceased
 
 
Patent Citations (3)
| Publication number | Priority date | Publication date | Assignee | Title | 
|---|---|---|---|---|
| KR100813884B1 (ko) | 2006-10-10 | 2008-03-18 | 전자부품연구원 | 우선순위를 지원하는 확률 기반 매체 접근 방법 및 이를실현시키기 위한 프로그램을 기록한 컴퓨터로 판독 가능한기록 매체 | 
| KR20090022366A (ko) | 2007-08-30 | 2009-03-04 | 주식회사 케이티 | 무선 센서 네트워크에서의 백오프 시간 결정 방법 및 이를이용한 채널 접근 방법 | 
| KR102308799B1 (ko) | 2020-07-10 | 2021-10-01 | 영남대학교 산학협력단 | 사물 인터넷 네트워크 환경에서 mac 계층 충돌 학습을 기초로 전달 경로를 선택하는 방법, 이를 수행하기 위한 기록 매체 및 장치 | 
Similar Documents
| Publication | Publication Date | Title | 
|---|---|---|
| Sharma et al. | Collaborative distributed Q-learning for RACH congestion minimization in cellular IoT networks | |
| De Guglielmo et al. | A performance analysis of the network formation process in IEEE 802.15. 4e TSCH wireless sensor/actuator networks | |
| US8027327B2 (en) | Distributed scheduling in wireless networks with service differentiation | |
| Bhar | A Mac protocol implementation for wireless sensor network | |
| CN107370550B (zh) | 面向实时WiFi的基于信道统计信息的速率自适应方法 | |
| KR102664367B1 (ko) | Wi-SUN에서의 강화학습을 이용한 비슬롯 기반 CSMA/CA 최적화를 위한 장치 및 방법 | |
| Pacheco-Paramo et al. | Deep reinforcement learning mechanism for dynamic access control in wireless networks handling mMTC | |
| Ali et al. | Performance optimization of QoS-supported dense WLANs using machine-learning-enabled enhanced distributed channel access (MEDCA) mechanism | |
| Ndih et al. | An analytical model for the contention access period of the slotted IEEE 802.15. 4 with service differentiation | |
| Pacheco-Paramo et al. | Delay-aware dynamic access control for mMTC in wireless networks using deep reinforcement learning | |
| Beaver et al. | Power-aware in-network query processing for sensor data | |
| Dutta | IEEE 802.15. 4 as the MAC protocol for internet of things (IoT) applications for achieving QoS and energy efficiency | |
| Zhang et al. | A blind adaptive tuning algorithm for reliable and energy-efficient communication in IEEE 802.15. 4 networks | |
| Kone et al. | Adaptive management of energy consumption, reliability and delay of wireless sensor node: Application to IEEE 802.15. 4 wireless sensor node | |
| KR20240091474A (ko) | Ieee 802.15.4 비슬롯 csma/ca의 대규모 사물인터넷을 위한 강화학습 기반 동적 백오프 파라미터 선택 장치 및 방법 | |
| Qureshi et al. | FuCWO: a novel fuzzy-based approach of contention window optimization for IEEE-802.15. 6 WBANs | |
| Zhu et al. | Delay analysis for IEEE 802.15. 4 CSMA/CA scheme with heterogeneous buffered traffic | |
| CN105792287B (zh) | 无线体域网的保护时隙自适应分配及性能评价方法 | |
| Constante et al. | Enhanced association mechanism for IEEE 802.15. 4 networks | |
| Kuo et al. | Performance enhancement of IEEE 802.11 DCF using novel backoff algorithm | |
| Orozco-Barbosa | Performance study of the IEEE 802.15. 6 slotted aloha mechanism with power control in a multiuser environment | |
| Mouzehkesh et al. | Traffic aware fuzzy-tuned delay range for wireless body area networks medium access control protocol (MAC) | |
| Li et al. | Constrained Flooding Based on Time Series Prediction and Lightweight GBN in BLE Mesh | |
| Zuo et al. | PDCF-DRL: a contention window backoff scheme based on deep reinforcement learning for differentiating access categories | |
| Vanitha et al. | Game theory and fuzzy based back off algorithm for MAC protocol for multi traffic flows in ad hoc networks | 
Legal Events
| Date | Code | Title | Description | 
|---|---|---|---|
| PA0109 | Patent application | 
             St.27 status event code: A-0-1-A10-A12-nap-PA0109  | 
        |
| PA0201 | Request for examination | 
             St.27 status event code: A-1-2-D10-D11-exm-PA0201  | 
        |
| D13-X000 | Search requested | 
             St.27 status event code: A-1-2-D10-D13-srh-X000  | 
        |
| PN2301 | Change of applicant | 
             St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301  | 
        |
| R18-X000 | Changes to party contact information recorded | 
             St.27 status event code: A-3-3-R10-R18-oth-X000  | 
        |
| PG1501 | Laying open of application | 
             St.27 status event code: A-1-1-Q10-Q12-nap-PG1501  | 
        |
| PN2301 | Change of applicant | 
             St.27 status event code: A-3-3-R10-R13-asn-PN2301 St.27 status event code: A-3-3-R10-R11-asn-PN2301  | 
        |
| R18-X000 | Changes to party contact information recorded | 
             St.27 status event code: A-3-3-R10-R18-oth-X000  | 
        |
| E902 | Notification of reason for refusal | ||
| PE0902 | Notice of grounds for rejection | 
             St.27 status event code: A-1-2-D10-D21-exm-PE0902  | 
        |
| R17-X000 | Change to representative recorded | 
             St.27 status event code: A-3-3-R10-R17-oth-X000  | 
        |
| T11-X000 | Administrative time limit extension requested | 
             St.27 status event code: U-3-3-T10-T11-oth-X000  | 
        |
| T11-X000 | Administrative time limit extension requested | 
             St.27 status event code: U-3-3-T10-T11-oth-X000  | 
        |
| PE0601 | Decision on rejection of patent | 
             St.27 status event code: N-2-6-B10-B15-exm-PE0601  |