소식

최대 속도는 1440 배! GCN을 사용하여 15초 안에 확률론적 계획을 완료합니다. 이는 중국과학원 자동화 연구소의 새로운 성과입니다.

2024-08-10

한어Русский языкEnglishFrançaisIndonesianSanskrit日本語DeutschPortuguêsΕλληνικάespañolItalianoSuomalainenLatina

중국과학원 자동화연구소 제공

Qubits 공개 계정 QbitAI

확률론적 계획 문제를 해결하는 데 단 15초가 소요되며, 이는 기존 방법보다 1440배 빠릅니다!

중국과학원 자동화 연구소의 새로운 연구에서는 GCN을 사용하여 이러한 문제에 대한 새로운 돌파구를 마련했습니다. 이 논문은 최고의 AI 컨퍼런스인 ICML 2024에 선정되었습니다.

이는 불확실한 상황에서도 효율적인 의사결정이 가능하다는 것을 의미합니다.

불확실성 하에서의 의사결정은 의사결정 문제의 중요한 유형으로, 의사결정자는 모든 무작위적인 상황을 충분히 고려하고 가장 합리적인 결정을 내려야 합니다.

수학 분야에서 일반적으로 사용되는 솔루션은 확률론적 프로그래밍이며, 이는 수학적 프로그래밍 모델에 확률 변수를 포함합니다.

그 중 2단계 확률론적 프로그래밍(2SP)은 이러한 의사결정 문제를 모델링하는 효과적인 방법으로 널리 사용됩니다.

중국과학원 자동화 연구소의 HGCN2SP 모델(HGCN은 Hierarchical Graph Convolution Network의 약자)의 이러한 성과는 정확히 2SP 방법과 HGCN2SP 방법의 조합입니다.그림컨벌루션 네트워크와 결합된 이 모델은 이러한 문제를 보다 효율적으로 해결하는 데 사용될 수 있습니다.

논문의 제1저자는 해당 연구소의 박사과정 학생인 Wu Yang이고, 연구원인 Zhang Yifan이 교신저자이다.

2단계 확률론적 프로그래밍이란 무엇입니까?

확률론적 계획의 기본 아이디어는 문제의 가능한 미래 상황을 여러 샘플 시나리오로 변환한 다음 각 샘플 시나리오를 최적화하고 마지막으로 모든 시나리오의 최적화 결과를 통합하여 현재 결정을 안내하는 것입니다.

적용 분야에는 공급망 관리, 금융 투자, 에너지 파견, 재난 비상 관리 등이 포함됩니다.

2단계 확률론적 계획은 이름에서 알 수 있듯이 프로세스를 두 단계로 나눕니다.

특히 이 두 단계에서는 총 비용을 최소화하거나 총 이익을 최대화하기 위해 각각 거시적 결정과 미시적 결정을 내려야 합니다.

첫 번째 단계의 결정은 불확실성이 나타나기 전에 이루어지며, 가능한 다양한 미래 시나리오에 적응하기 위해 초기 결정을 최적화하는 것을 목표로 합니다.

두 번째 단계의 결정은 불확실성이 나타난 후에 이루어지며 첫 번째 단계의 결정과 실제로 발생한 일을 기반으로 조정되어 전체 결과를 최적화합니다.

2SP 모델을 통해 의사결정자는 의사결정 과정에서 발생할 수 있는 다양한 시나리오의 영향을 충분히 고려함으로써 의사결정의 견고성과 유연성을 향상시키고 보다 과학적이고 효율적인 의사결정을 내릴 수 있어야 합니다.

예를 들어, 주변 20개 지역의 요구 사항을 충족하기 위해 창고를 건설하기 위해 10개의 후보 위치 중 일부를 선택한다고 가정합니다.

첫 번째 단계에서 결정해야 할 것은 이 10개의 후보 위치 중 어느 위치를 선택해야 하는가입니다.

2단계에서는 창고와 지역간의 유통관계를 판단해야 한다. 이때 결정변수의 수는 최대 200개이다(즉, 창고i가 지역j에 유통되는지 여부).

△DALL·E에서 생성된 이미지

수학적으로 2SP 문제는 일반적으로 다음과 같이 표현됩니다.

그 중 Q(x,ξ)는 1단계 결정 x와 시나리오 ξ를 고려한 2단계 최적화 문제를 나타내며 그 형식은 다음과 같습니다.

실제 솔루션에서는 일반적으로 N 장면을 샘플링하여 해당 Q 값을 계산하여 기대치를 근사화합니다.

분명히 N이 클수록 근사의 신뢰성이 높아집니다. 그러나 시나리오 수가 증가하면 문제의 크기가 급속히 확대되어 해결 시간이 크게 늘어납니다.

창고 위치 선택 문제를 사용하여 더 나은 위치 선택 결정을 내리려면 수요, 날씨, 사람 흐름, 교통 등과 같은 불확실한 요소를 고려해야 하며 각 요소의 변화는 다음과 같습니다. 시나리오.

이는 실제 상황을 최대한 가깝게 시뮬레이션하려면 N개의 서로 다른 시나리오를 광범위하게 샘플링해야 함을 의미합니다. 이때 두 번째 단계의 의사결정 변수의 총 개수는 200N에 달해 해결 시간이 매우 길어진다.

실제로 N이 500일 때 가장 발전된 상용 솔버 구로비를 사용해도 최적의 결정을 내리는 데 최소 6시간이 걸린다.

전통적인 방법은 일반적으로 무작위 샘플링 또는 클러스터링 기술을 사용하여 대략적인 솔루션을 위한 소수의 시나리오(예: 10개 또는 20개)를 선택합니다. 시간은 단축되지만 결과 결정의 품질은 이상적이지 않은 경우가 많습니다.

이를 바탕으로 HGCN2SP 모델의 설계 아이디어가 도출되었습니다. 샘플링 장면 수를 줄이면서 최대한 정확한 결과를 얻으십시오.

그래프 컨벌루션 네트워크를 사용하여 2SP 문제 해결

연구팀은 2단계 확률론적 프로그래밍 문제를 해결하기 위해 계층적 그래프 컨볼루션 네트워크를 기반으로 하는 HGCN2SP 모델을 제안했습니다.

특히 알고리즘 설계 측면에서 팀은 계층적 그래프를 구성하여 2SP 문제를 특성화했으며, 하단 그래프는 각 장면의 특성을 나타내고 상단 그래프는 장면 간의 관계를 나타냅니다.

그런 다음 HGCN(Hierarchical Graph Convolutional Network)을 사용하여 기본 장면 하위 그래프의 임베딩 정보와 최상위 장면 공간의 구조 정보를 마이닝하여 장면 표현을 추출합니다.

어텐션 메커니즘 기반 디코더는 장면을 순서대로 선택하는 데 사용되며 문제를 단순화하기 위해 대표 장면을 찾을 수 있을 뿐만 아니라 심플렉스 방법으로 문제를 해결할 때 순서를 최적화하여 초기 기반 선택을 향상시킵니다. 장면 해결 시간이 크게 향상됩니다.

△HGCN2SP 모델 프레임워크

또한 팀은 강화 학습(RL)을 결합하여 의사결정 품질과 해결 시간을 종합적으로 검토하여 모델 매개변수를 최적화함으로써 문제 해결의 효율성과 품질을 크게 향상시켰습니다.

위 창고 위치 문제에서 HGCN2SP는 10개의 시나리오만 선택했지만 6시간 만에 결정 결과와 구로비 솔버가 내린 결정의 차이는 1.7%에 불과했고, 해결 시간은 15초에 불과해 속도와 동일했다. 개선은 1440배로 이 방법의 효과를 완전히 반영합니다.

또한 NDP(Network Design Problem) 실험에서 HGCN2SP는 기존 방식에 비해 절반도 안 되는 시간에 유사한 의사결정 효과를 달성했다.

특히 대규모 인스턴스와 다수의 시나리오에서 HGCN2SP는 여전히 강력한 일반화 기능을 유지합니다.

HGCN2SP의 제안은 복잡한 2SP 문제를 해결하기 위한 새로운 아이디어와 도구를 제공하며 광범위한 응용 가능성을 가지고 있습니다.

연구팀은 모델을 더욱 최적화하고, 훈련 비용을 절감하며, 보다 실제적인 문제에 대한 적용을 탐색할 계획입니다.

논문 주소:
https://openreview.net/forum?id=8onaVSFTEj