윤준영
(Jun-Young Yun)
1
조진우
(Jin Woo Cho)
2
조은선
(EunSeon Cho)
3
한상환
( Sang Whan Han)
4*iD
-
한양대학교 건축공학과 대학원생
(Graduate Student, Department of Architectural Engineering, Hanyang University, Seoul
04763, Rep. of Korea)
-
한양대학교 건축공학과 석사
(Graduate, Department of Architectural Engineering, Hanyang University, Seoul 04763,
Rep. of Korea)
-
한양대학교 건축공학과 박사 후 연구원
(Ph.D., Department of Architectural Engineering, Hanyang University, Seoul 04763, Rep.
of Korea)
-
한양대학교 건축공학과 교수
(Professor, Department of Architectural Engineering, Hanyang University, Seoul 04763,
Rep. of Korea)
Copyright © Korea Concrete Institute(KCI)
키워드
철근콘크리트 기둥, 백본커브, 기계학습, 정확도, 모델링 파라미터
Key words
reinforced concrete column, backbone curve, machine learning, accuracy, modeling parameter
1. 서 론
철근콘크리트(RC) 골조는 국내외에서 가장 널리 사용되는 구조 형식 중 하나로, 건물의 안전성을 유지하기 위한 중요한 구조 시스템 중 하나이다. 지진과
같은 횡하중이 가해질 때, 하중에 의한 힘이 기둥, 보, 접합부 등의 구조부재에 축력, 모멘트, 전단력, 비틀림의 형태로 발생하게 된다(Ha and Han 2016a). 특히, 최하단부에 위치한 기둥은 상부층에서 전달되는 휨 및 압축력과 횡력에 저항할 수 있도록 설계되어야 한다. 기둥의 단부에서 발생하는 과도한
변형이나 내력저하 등의 손상은 전체 구조물의 sway mechanism에 영향을 미칠 수 있으며, 이는 건물의 안정성을 저해하고 붕괴를 초래할 수
있다(Guo et al. 2017). 따라서 RC 기둥의 변형 능력(drift capacity)과 강도(strength)를 정량적으로 예측하는 것은 구조물의 안정성과 성능 기반 내진설계의
관점에서 매우 중요하다.
이러한 중요성에 따라, 국내외 설계기준에서는 RC 기둥의 성능을 확보하기 위한 하중 산정 절차 및 설계 지침을 제시하고 있으며, 성능 기반 내진설계
및 평가를 통해 지진 하중에 대한 저항 능력을 확보하도록 요구하고 있다. 하지만 실제 구조물의 기둥은 다양한 형상, 하중 조건, 철근 배치, 축력비
등에 따라 복합적인 거동 특성을 보이며, 이를 일반화된 형태로 정량화하는 데는 여전히 한계가 존재한다.
수많은 선행연구에서는 실험 데이터를 기반으로 다양한 예측 모델을 제시해왔다. 다수의 선행 연구(Elwood and Moehle 2005; Ha and Han 2016b)에서는 RC 기둥의 파괴모드나 파라미터(단면 형상, 재료 특성, 축력비 등)에 따른 경험식을 제안하였고, FEMA P-58 (2018)과 ACI 369 (2011)와 같은 대규모 데이터베이스가 축적되어 왔다. 하지만 이러한 경험식들은 특정 조건과 하중 이력을 바탕으로 개발되어 있어, 다양한 설계 조건을 포괄하거나
일반화된 예측에는 한계가 있다.
이러한 한계를 극복하기 위한 대안으로 기계학습(machine learning, ML) 기법의 적용이 구조공학 분야에서 활발히 이루어지고 있다. ML
기법은 복잡한 변수 간의 비선형 관계를 학습할 수 있어, 기존 통계 모델이나 경험식보다 더 정확하고 유연한 예측이 가능하다(Siddique et al. 2011). 기계학습 모델 중 하나인 XGBoost(eXtreme Gradient Boosting)는 여러 개의 결정 트리를 조합하여 과적합을 제어하고 높은
예측 성능을 보장하는 앙상블 학습 알고리즘으로, 다양한 구조 특성과 하중 조건이 복합된 상황에서도 안정적인 예측이 가능하다(Chen and Guestrin 2016). 특히, XGBoost는 최신 공학 연구에서 뛰어난 성능을 발휘하는 것으로 보고하고 있고(Ribeiro and dos Santos Coelho 2020; Zhang et al. 2021), 본 연구에서도 이를 사용하였다.
본 연구에서는 XGBoost 알고리즘을 활용하여 RC 기둥의 뼈대곡선을 예측할 수 있는 모델을 구축하고자 한다. 이를 위해 ACI 369 데이터베이스를
기반으로 실험 데이터를 수집하고, 기둥의 단면 형상, 철근 세부사항, 축력비 등의 입력변수를 사용하여 기둥 뼈대곡선의 모델 파라미터를 출력 변수로
설정하였다. 수집된 데이터베이스 중 80 %는 모델 학습에 활용하고, 나머지 20 %는 검증에 활용하여 예측 성능을 정량적으로 평가하였다. 또한 결정계수($R^{2}$)
및 예측값과 실측값의 차이를 통해 모델의 정확도를 분석하였다.
2. RC 기둥 데이터베이스 수집
RC 기둥 데이터베이스를 구축하기 위해 ACI 369 Rectangular Column Database(Ghannoum and Sivaramakrishnan 2012)으로부터 하중-변위비 응답과 단면 및 물성치를 수집하였다. 본 연구에서는 지진과 같은 횡력에 대한 기둥의 응답을 예측하고자 반복 하중을 받는 실험체만을
고려하였다. 총 60개의 문헌에서 275개의 기둥 실험체를 수집하였다. 입력 변수 선정은 희소 변수 분석과 상관계수 분석을 통해 최종 22개의 입력변수를
선정하였다.
수집된 기둥 실험체의 설계 변수는 Fig. 1과 같으며, 물성치별 통계적 요약은 Table 1에 정리하였다.
Fig. 1 Reinforced concrete column variables
Table 1 Reinforced concrete column material properties
|
Variable
|
Min.
|
Max.
|
$\mu$
|
$\sigma$
|
$\delta$
|
|
$a$
(mm)
|
80
|
2500
|
1,080
|
588
|
0.54
|
|
$s$
(mm)
|
11
|
457
|
109
|
95
|
0.87
|
|
$l_{n}$
(mm)
|
160
|
2950
|
1,250
|
623
|
0.50
|
|
$D_{l}$
(mm)
|
0
|
32
|
17
|
6
|
0.35
|
|
$D_{t}$
(mm)
|
3
|
203
|
8
|
12
|
1.50
|
|
$f^{'_{c}}$
(MPa)
|
13
|
118
|
48
|
29
|
0.60
|
|
$f_{yl}$
(MPa)
|
318
|
586
|
426
|
63
|
0.15
|
|
$f_{yt}$
(MPa)
|
249
|
1420
|
476
|
213
|
0.45
|
|
$\rho_{l}$
|
0.0068
|
0.0694
|
0.0238
|
0.0102
|
0.43
|
|
$\rho_{t}$
|
0.0006
|
0.0321
|
0.0069
|
0.0054
|
0.78
|
|
$a/d$
|
1.15
|
8.90
|
3.85
|
1.64
|
0.43
|
|
$s/d$
|
0.04
|
1.27
|
0.39
|
0.25
|
0.64
|
|
$l_{n}/h$
|
1.33
|
7.64
|
3.91
|
1.30
|
0.33
|
|
$P/A_{g}f'_{c}$
|
0.0
|
0.9
|
0.25
|
0.18
|
0.72
|
|
$V_{p}/V_{n}$
|
0.10
|
1.95
|
0.62
|
0.38
|
0.61
|
|
$A_{g}/A_{0}$
|
0.3
|
6.97
|
1.85
|
1.38
|
0.75
|
3. 뼈대곡선 구축위한 손상수준(Damage state)
지진 발생 시 철근콘크리트(RC) 구조 부재는 경미한 균열에서부터 극심한 파괴에 이르기까지 연속적인 형태의 손상을 경험하게 된다. 이러한 손상을 정량화하는
것은 구조물의 성능을 평가하고, 향후 지진에 대한 손상 정도를 예측하는 데 필수적이다(FEMA 2018). 구조 부재의 손상을 세분화된 수준으로 정의함으로써, 성능기반 내진설계 및 성능평가에 필요한 기초 정보를 제공할 수 있으며, 이는 구조물의 경제적
손실 평가 및 수리·보강 기준으로도 활용될 수 있다.
손상은 일반적으로 층간 변위비, 층 가속도, 잔류 변위비 등의 공학적 요구 매개변수(engineering demand parameters, EDPs)를
통해 정의되며, 이 중에서도 층간 변위비(interstory drift ratio)는 RC 골조 시스템에서 발생하는 변형을 가장 직접적으로 반영하는
주요 지표로 활용된다. Erduran (2012)은 변위비가 RC 골조에 작용하는 횡하중에 따른 구조적 손상과 가장 밀접한 상관관계를 가지는 변수임을 제시한 바 있다. 그러나 선행연구들에서 손상수준에
해당하는 실험체의 변위비를 명확히 제시한 경우는 제한적이며, 연구마다 손상 수준의 정의 방식이 상이하여 통일된 기준이 부족한 실정이다.
이에 본 연구에서는 ASCE 41-23 (2023)에서 제시하는 이상화된 뼈대곡선(idealized backbone curve)의 개념을 도입하여, RC 기둥의 손상을 변위 기반으로 정량화하고, 이를
세 가지 수준의 손상으로 정의하였다. 각 손상수준은 다음과 같다: (1) 손상수준($DS_{1}$): 경미한 균열(항복하중 시점), (2) 손상수준($DS_{2}$):
심각한 균열(최대하중 시점), (3) 손상수준($DS_{3}$): 극심한 손상(파괴).
Fig. 2는 기둥 부재의 손상수준을 전단력(shear force)과 층간 변위비의 관계로 정의한 그래프이다. 여기서, 회색 실선은 실험체의 이력 거동을 나타낸
곡선으로, 반복하중에 따른 실제 기둥의 비선형 거동을 보여준다. 파란색 실선은 ASCE (2023) 기준에 따라 도출된 뼈대곡선(envelope curve)으로, 실험 데이터를 바탕으로 하중–변위 응답에서의 최대 변위 점을 이어 작성한다. 빨간색
점선은 뼈대선을 단순화한 형태인 이상화된 뼈대곡선으로, 손상수준 정의를 위한 기준선 역할을 한다.
Fig. 2 Definition of damage state
3.1 손상수준 1($BOLD DS_{1}$): 경미한 균열(항복하중 시점)
항복하중 도달 시점을 기준으로 정의되며, 구조 부재에 초기 균열이 발생하고 재료의 비선형 거동이 시작되는 구간을 의미한다. 이 수준의 손상은 경미한
균열(cracking)이 관찰되는 상태로, 구조적 기능은 유지되지만, 외관상 손상이 발생하여 에폭시 주입(epoxy injection)과 같은 국부적
보수조치가 필요한 단계이다(FEMA 2018). Gogus and Wallace (2015)에서는 해당 손상수준을 철근 항복이 발생하는 시점으로 제시한 바 있으며, 이는 RC 기둥의 성능 저하가 시작되는 중요한 시점으로 간주된다. 그러나
실제 실험에서는 RC 부재의 반복하중 응답만으로 항복점을 명확히 정의하기가 어려운 경우가 많다. 항복 이후에도 하중은 지속해서 증가하며, 변위-하중
곡선상에서 항복의 위치는 명확하게 드러나지 않는 경우가 많기 때문이다. 이에 본 연구에서는 ASCE 41-23(7.4.3.2)에서 제시한 방법론을
적용하여 항복점을 정량적으로 정의하였다. 그 절차는 다음과 같다: (1) 실험체의 하중-변위비 응답으로부터 첫 번째 사이클에서의 최대변위를 연결한
뼈대곡선을 추출한다. (2) 실험체의 항복하중($V_{y}$)을 초기 추정값으로 가정한다. (3) 뼈대곡선상에서 $V_{y}$에 해당하는 점과 원점을
연결하는 직선을 그려 이를 연장한다. (4) 뼈대곡선상에서 최대하중 $V_{\max}$에 도달하는 시점을 결정한다. (5) 이중 선형 이상화 곡선을
구축하기 위해 원점, 항복점, 그리고 최대하중 도달점의 조합으로 형성된 곡선과 실제 뼈대곡선 간의 면적 차가 최소가 되도록 항복점을 재조정한다. (6)
이때의 변위값 $\theta_{y}$를 손상수준 1에 해당하는 시점으로 정의한다.
3.2 손상수준 2($BOLD DS_{2}$): 심각한 균열(최대하중 시점)
손상수준 2는 구조 부재가 최대하중에 도달하는 시점을 기준으로 정의되며, 구조 성능이 최고조에 이른 상태이자 손상이 본격화되기 시작하는 단계이다.
이 시점에서는 이미 주요 철근의 항복이 발생하고, 극심한 휨 균열 및 전단 균열이 RC 기둥에 나타나며, 구조 부재의 강성 저하(stiffness
degradation)가 관찰된다. 구조 부재는 강도를 유지하기 위한 에너지를 점차 소산하면서, 최대하중 이후에는 대각 균열, 주철근의 좌굴 및 콘크리트
피복의 박리 등과 같은 국부 손상을 경험하게 된다(Cardone and Perrone 2017). 이를 기반으로 다수의 선행연구에서는 손상수준 2를 최대하중 도달 시점으로 정의하고 있다. 본 연구에서도 이와 동일하게 하중-변위비 응답에서 최대하중에
도달하는 시점에서의 변위비를 손상수준 2로 정의하였다.
3.3 손상수준 3($BOLD DS_{2}$): 극심한 손상(파괴)
손상수준 3은 구조 부재에서 강도 저하가 본격적으로 발생하는 시점으로 정의되며, 이때는 콘크리트의 압축 파괴, 철근의 파단, 기둥 단부의 국부 붕괴
등과 같은 극한 손상이 동반된다. 해당 수준의 손상이 발생하면 구조물은 더 이상 횡하중을 효과적으로 저항할 수 없게 되어 구조물의 안전성과 내진 성능을
결정짓는 구조적 한계 상태로 간주된다(ASCE 2023).
FEMA P58 (2018)에 따르면, 손상수준 3은 구조 부재가 하중을 더 이상 지지할 수 없을 정도의 심각한 손상과 기능 상실이 발생하는 시점의 변위비로 정의된다. 그러나
실제 실험에서는 기둥의 파괴 형태가 명확하게 기록되지 않거나, 실험 종료 조건이 연구마다 상이하여 손상수준 3을 일관되게 정의하기가 어렵다. 일부
실험은 내력 저하 이전에 종료되거나, 시험 장비의 한계로 인해 극한 손상이 충분히 반영되지 않는 경우도 존재한다.
이에 따라 본 연구에서는 데이터의 일관성과 비교 가능성을 확보하기 위해, Cardone and Perrone (2017), FEMA P58 (2018), Goksu (2021) 등에서 제시된 접근방식을 참조하여, 기둥의 최대 내력($V_{u}$)에서 20 % 감소한 시점의 변위비를 손상수준 3으로 정의하였다.
Fig. 3은 본 연구에서 정의한 손상수준($DS_{1}$, $DS_{2}$, $DS_{3}$)에 해당하는 각 실험체의 층간 변위비 분포를 나타낸 것이다. 빨간색
마름모는 $DS_{1}$, 파란색 삼각형은 $DS_{2}$, 초록색 사각형은 $DS_{3}$에 해당한다.
이와 같은 결과는 손상수준에 도달하는 변위비가 철근 상세, 하중 조건, 재료 특성, 단면 형상, 축력비 등 다양한 구조적 변수에 따라 큰 차이를 보인다는
것을 의미한다. 동일한 손상수준이라 하더라도 실험체의 설계 조건에 따라 변위 응답의 분산이 크게 나타나며, 이는 구조 성능 데이터의 높은 불확실성과
비정형성을 시사한다.
이러한 특성을 고려할 때, 선형 회귀나 경험식 기반의 단순 모델은 손상수준 간의 경계를 정확하게 식별하거나 예측하는 데 한계를 가진다. 반면, 기계학습은
고차원 변수 간의 비선형 관계를 효과적으로 학습할 수 있으며, 다양한 설계 조건에 따른 응답의 변동성을 포괄적으로 반영할 수 있다. 따라서 본 연구와
같이 변위비의 분산이 크고 실험체 간 편차가 존재하는 구조 성능 데이터를 다룰 때, 기계학습은 손상 수준을 정량적으로 분류하기 위한 유효한 대안으로
작용한다.
Fig. 3 Distributions of $\theta$ for individual damage states
4. 기계학습(Machine learning, ML)
기계학습은 데이터로부터 스스로 학습하고 예측 모델을 구축하는 알고리즘 기반 접근 방식으로, 학습 방식에 따라 지도학습(supervised learning),
비지도학습(unsupervised learning), 강화학습(reinforcement learning)으로 구분된다. 이 중 본 연구에서는 입력값과
이에 대응하는 정답(출력값)이 명확하게 주어지는 지도학습 기법을 활용하였다. 지도학습은 입력 데이터와 출력 데이터 간의 관계를 학습하여 새로운 입력에
대해 결과를 예측하는 데 효과적이며, 구조공학 분야에서는 구조 응답 예측, 성능 분류, 손상 상태 추정 등에 널리 적용되고 있다.
지도학습에서는 다양한 알고리즘이 사용될 수 있으며, 대표적으로 선형 회귀(linear regression), 서포트 벡터 머신(support vector
machine, SVM), 의사 결정 나무(decision tree) 등이 있다. 또한, 이들 개별 모델을 조합하여 성능을 향상시키는 앙상블 학습(ensemble
learning) 기법도 활발히 활용되며, 특히 높은 예측 정확도와 일반화 성능을 동시에 달성할 수 있다는 장점이 있다.
최근까지 많은 선행연구에서 RC 기둥의 변형 능력과 강도를 예측하기 위한 연구가 활발히 수행되고 있다. 앞 절에서 언급한 바와 같이 대부분의 연구는
기둥의 영향변수를 활용하여 모델 파라미터 값을 결정하기 위한 경험식을 제안하는 방식으로 기둥 부재의 응답을 예측하고 있다.
그러나 이러한 경험식은 새로운 데이터가 추가될 경우 이에 대한 고려가 되지 않아 신뢰성 있는 결과를 도출하는 데에 의문이 제기될 수 있다. 반면,
기계학습은 다차원 변수 간의 복잡한 비선형 관계를 학습하고, 데이터 기반으로 패턴을 도출할 수 있어 이러한 문제점을 효과적으로 해결할 수 있는 대안으로
주목받고 있다. 특히 새로운 데이터가 지속해서 수집되는 구조공학 분야에서는, 모델이 데이터를 기반으로 스스로 갱신되고 정밀도를 향상시킬 수 있다는
점에서 높은 실용성과 유연성을 가진다. 이에 따라 최근에는 RC 부재의 내력 및 변형 예측, 손상 분류, 내진 성능 평가 등 다양한 구조공학 분야에서
기계학습 기법이 활발히 적용되고 있으며, 그 적용 가능성과 정확도가 연구를 통해 검증되고 있다(Xie et al. 2020).
XGBoost는 Chen and Guestrin (2016)에 의해 제안된 앙상블 학습 모델로, 여러 개의 약한 학습기(weak learners)인 결정 트리를 순차적으로 학습시켜 높은 성능의 예측 모델을
구성한다.
Fig. 4에서 보이는 바와 같이 이 알고리즘은 이전 단계에서 발생한 예측 오차, 즉 잔차(residual)을 반복적으로 줄여나가는 방식으로 학습이 진행된다.
모델은 초기 예측값에서 시작해, 반복마다 잔차를 예측하는 새로운 결정 트리를 추가하며 전체 예측 성능을 점진적으로 향상시킨다.
또한, XGBoost는 정규화 기법과 조기 중단기능을 통해 과적합을 방지하고 모델의 일반화 능력을 향상시키며, 병렬 처리 구조를 기반으로 높은 학습
효율성과 속도를 제공한다. 이러한 특성 덕분에 XGBoost는 다양한 분야에서 예측 정확도와 연산 효율성을 모두 만족시키는 강력한 알고리즘으로 인정받고
있으며, 본 연구에서도 기둥 부재의 손상수준을 예측하기 위한 핵심 모델로 활용하고자 한다. 주요 매커니즘의 상세 설명은 다음과 같다.
Fig. 4 Boosting procedure of the XGBoost algorithm
4.1 경사하강법(gradient descent)
XGBoost는 경사하강법을 기반으로 한 부스팅(boosting) 알고리즘으로, 각 반복마다 이전 모델이 예측하지 못한 잔차를 학습하여 모델을 점진적으로
개선한다. 경사하강법은 주어진 손실 함수를 최소화하는 방향으로 모델의 파라미터를 반복적으로 갱신하는 최적화 기법이며, 다음과 같은 방식으로 예측이
갱신된다. 식 (1):
여기서, $\hat{y}_{i}^{(t)}$와 $\hat{y}_{i}^{(t-1)}$는 각각 $t$와 $t-1$번째 반복에서의 예측값을 의미하고,
$f_{t}(x_{i})$는 $t$번째 트리 모델의 출력인 잔차 추정치를 의미한다.
이러한 방식으로 초기 예측값에서 시작해 반복적으로 잔차를 보완함으로써, 실제값에 점차 수렴하도록 모델이 개선된다.
4.2 잔차 최소화
각 트리는 손실 함수의 경사 정보를 활용하여 예측 오차인 잔차를 최소화하는 방향으로 설계된다. 이를 통해 각 트리의 예측을 보완하여 높은 정확도를
달성하는 단계이다. 이때 전체 학습 목적 함수는 다음과 같이 표현된다. 식 (2):
여기서, $l$ 함수는 예측값과 실제값 간의 손실함수를 의미한다. $\omega(f_{t})$는 모델 복잡도에 대한 규제 항으로, $f_{t}$는
$t$번째 결정트리를 의미한다.
4.3 효율적인 잔차 연산(2차 테일러 근사)
XGBoost에서는 효율적인 잔차연산을 위해 경사하강법을 활용한다. 이를 위해 트리 구조 결정 시 사용되는 목적함수의 손실함수는 2차 테일러 급수로
근사하여 효율적인 계산이 가능하도록 학습한다. 이 방식은 단순 오차 기반 학습보다 더 빠르고 정밀한 최적화를 가능하게 한다. 이로 인해 각 반복에서
계산되는 목적함수는 다음과 같이 전개된다. 식 (3), (4):
이때, $g_{i}$와 $h_{i}$는 각각 1차, 2차 도함수를 의미한다.
4.4 트리 구조 결정
각 반복에서 생성되는 결정 트리 $f_{t}$는 입력 데이터를 여러 리프 노드로 분할하는 구조를 갖는다. 트리의 분할 기준은 손실 감소량(Gain)이며,
이는 각 노드의 분기 전후 목적 함수의 차이를 기반으로 계산된다. 가장 높은 Gain을 발생시키는 특성과 분기점이 선택되며, 이 과정을 통해 트리의
구조가 결정된다.
4.5 규제 항을 통한 과적합 제어
XGBoost는 모델의 일반화 성능을 유지하기 위해 규제 항을 도입하여 트리의 복잡도를 제어한다. 규제 항은 각 트리와 리프 노드의 개수와 해당 트리의
트리 구조가 복잡할수록 입력 데이터에 대한 과적합이 발생하여 새로운 데이터에 대한 정확도가 떨어질 수 있다. 이때, 규제 항은 트리의 복잡성을 나타내는
지표로 작용하며 식 (5)로 정의되어 목적함수에 반영된다.
여기서, $J_{k}$와 $w_{j}$는 각각 리프 노드의 수와 출력값(가중치)를 의미한다. 또한, $\gamma$는 리프 수에 대한 정규화 항을
나타내며, $\lambda$는 L2 정규화 계수를 의미한다.
5. 예측 모델 학습 절차 및 검증
본 연구에서는 철근콘크리트(RC) 기둥의 손상수준을 예측하기 위해 XGBoost 알고리즘을 기반으로 한 지도학습 모델을 구축하였다. Fig. 5는 전체 모델 개발 및 검증 과정의 흐름을 단계적으로 나타낸 것이다.
Fig. 5 Development and validation of model
5.1 모델 학습
첫 단계에서는 신뢰성 있는 예측 모델을 개발하기 위해, 선행연구 기반의 실험 데이터베이스를 수집하여 입력 변수($X$)와 출력 변수($y$)로 구성된
원시 데이터셋을 정리하였다.
이후 모델 성능을 최적화하기 위해, 대표적인 하이퍼파라미터 탐색 기법인 그리드 서치법을 활용하여 후보 조합을 사전 정의하였다. 그리드 서치는 사전에
정의된 하이퍼파라미터 조합을 전수 탐색(full search)하는 방식으로, 탐색 공간 내 가능한 모든 조합을 평가하여 전역 최적 해에 근접한 설정을
도출할 수 있다. 또한 동일한 조건에서 항상 같은 결과를 도출할 수 있어, 실험의 재현성과 공정한 성능 비교가 가능하다는 장점이 있다.
하이퍼파라미터 탐색 및 모델의 일반화 성능 확보를 위해, K-fold 교차검증을 수행하였다. Fig. 6에서 보이듯이 이 기법은 전체 데이터를 K개의 하위 집합으로 나눈 후, 각 반복마다 하나의 하위 집합을 검증용으로, 나머지를 학습용으로 사용하는 방법으로,
모델의 성능이 특정 데이터 분할에 의존하지 않도록 한다. 이 과정을 k번 반복하며 최종 성능지표는 이에 대한 평균값으로 계산된다. 본 연구에서는 10겹
교차검증을 활용하였으며, 10 data folds의 평균 결정계수가 0.7 이상인 경우에 한하여 유효한 모델이 구축되었음을 확인하였다.
이후 전체 데이터를 학습용(80 %)과 테스트용(20 %)으로 구분하는 데이터 분할을 수행하였다. 학습 데이터는 모델 학습 단계에서 사용되며, 테스트
데이터는 학습된 모델의 예측 성능을 정량적으로 검증하는 데 활용된다. 이 과정을 통해 데이터 과적합 여부를 사전에 점검하고, 모델의 일반화 성능을
확보할 수 있다. 최종적으로, 테스트 데이터를 이용한 모델의 예측값과 실제값을 비교하여 성능을 평가하였으며, 결정계수($R^{2}$)을 기반으로 모델의
정량적 신뢰성을 비교하였다.
Fig. 7은 손상수준에 대한 변위비($\theta_{DS1},\: \theta_{DS2},\:\theta_{DS3}$) 예측에 대한 테스트 세트의 결정계수는
각각 0.792, 0.812, 0.700으로 나타났으며, 이는 학습 세트와 비교하여 과적합 없이 안정적인 예측 성능을 보였음을 의미한다. 또한 항복하중($V_{y}$)과
최대하중($V_{u}$) 예측에 대해서도 각각 0.887, 0.969의 결정계수를 가지는 것으로 나타났다. Fig. 7(f)를 보면, ASCE 41-23에서 제시한 비선형 매개변수 a와 비교하였을 때 학습과 테스트 세트의 결정계수는 각각 0.907, 0.851을 나타냈다.
반면, ASCE 41-23 경험식의 결정계수는 –0.06을 나타내어 학습된 모델에서 더 높은 성능을 보였다.
Fig. 6 10-fold cross-validation results
5.2 모델 검증
앞서 입력 변수에 따른 XGBoost 하이퍼파라미터 조율 및 데이터 전처리를 통해 제안된 모델의 예측 성능을 정량적으로 검증하였다. 본 절에서는 이를
보완하여 모델의 실효성을 정성적으로 검증하기 위해, 예측된 변위 응답을 기반으로 작성한 이상화된 뼈대곡선과 실제 실험 데이터를 기반으로 도출한 곡선을
비교하였다. 비교는 임의로 선정된 4개의 실험체를 대상으로 수행되었으며, 두 곡선 간의 차이는 이상화된 뼈대곡선 하부 면적의 적분값으로 정의되는 에너지
소산량을 기준으로 평가하였다. 오차율은 다음과 같이 계산하였다.
비교 결과는 Table 2에 정리되어 있으며, 대부분의 실험체에서 3 %~17 % 이내의 오차율을 보였고, 특히 No.1 실험체는 0.11 %의 매우 낮은 오차율을 기록하였다.
전체 평균 오차율은 3.58 %로 나타나, 제안된 머신러닝 기반 예측 모델이 RC 기둥의 비선형 거동 특성을 정량적으로 신뢰성 있게 반영할 수 있음을
확인하였다.
Fig. 8은 반복하중에 의한 기둥 응답을 대상으로, 실험 기반의 이상화 곡선과 XGBoost 예측값 기반의 이상화 곡선을 시각적으로 비교한 그래프이다. 회색
선은 전체 사이클 응답을, 파란색 선은 실험 기반 곡선을, 빨간색 선은 예측 기반 곡선을 의미한다. 모든 실험체에서 최대 강도 지점과 강도저하 이후의
경향까지 모델이 실험 응답을 유사하게 재현하고 있으며, 강도 및 변위비 모두에서 우수한 일치도를 보였다.
Table 2 Comparison of dissipated energy
|
Specimen
|
Measured energy dissipation
|
Predicted energy dissipation
|
Error (%)
|
|
c2-1
|
1,455
|
1,412
|
2.96
|
|
No.4
|
459
|
470
|
2.40
|
|
No1
|
566
|
565
|
0.18
|
|
4D13RS
|
371
|
403
|
8.63
|
6. 요약 및 결론
지진과 같은 횡하중에 의해 발생하는 철근콘크리트(RC) 골조의 최하단부에 위치한 기둥부재의 변형과 손상은 건물의 안전성에 큰 영향을 미칠 수 있어
손상수준 및 구조 성능을 정량적으로 예측하기 위해, 기계학습 기반 예측 모델을 개발하였다.
이를 위해 60개의 선행연구로부터 총 275개의 반복하중에 대한 기둥 실험체 데이터베이스를 수집하였다. 실험체의 하중-변위비 이력을 기반으로 손상수준을
다음과 같이 정의하였다.
1) 손상수준($DS_{1}$): 경미한 균열(항복하중 시점)
2) 손상수준($DS_{2}$): 심각한 균열(최대하중 시점)
3) 손상수준($DS_{3}$): 극심한 손상(파괴)
본 연구에서 사용한 XGBoost 모델은 앙상블 학습을 기반으로 하는 강력한 머신러닝 알고리즘으로 이는 다양한 데이터 패턴을 과적합을 제어하며 학습하여
안정적이고 정확한 예측을 가능하게 한다. 경사하강법, 잔차 최소화, 트리 구조 결정, 경사하강법에 따른 효율적인 잔차 연산, 규제 항을 통한 과적합
제어 등의 단계를 통해 모델을 구성하여 초기 값에서부터 실제 값에 점진적으로 가까워지며, 높은 정확도로 예측할 수 있다.
수집된 데이터 중 80 %는 학습에 활용되며, 나머지 20 %는 모델 검증에 활용된다. 모델의 정확도를 나타내는 결정계수가 $\theta_{DS1},\:
\theta_{DS2},\: \theta_{DS3},\: V_{y},\: V_{u}$에 대하여 각각 훈련 세트에 대해 0.9, 0.87, 0.9,
0.97, 0.96, 검증 세트에 대해 0.88, 0.84, 0.83, 0.95, 0.94의 값을 갖는 것으로 나타났다. 학습과 검증에 관계없이 대부분
0.8 이상의 높은 정확도를 보유하는 것으로 보아 모델이 높은 신뢰도를 갖는 것으로 평가된다.
기둥 변형능력 및 강도 예측의 개별 예측 능력뿐만 아니라 전체 이력에 대한 정확도를 재차 검증하였다. 이를 에너지 소산량에 대해 비교했을 때, 실험체
별 각각 2.97, 2.39, 0.11과 8.85 %의 오차율을 갖는 것으로 평가되었다. 또한, 평균과 최대 오차율이 각각 3.58 %와 최대 8.85
%로 모두 10 % 이내의 높은 정확도를 갖는 것으로 나타났다.
이를 통해 본 연구에서 구축한 기둥 변형 능력 및 강도 예측을 위한 XGBoost 모델이 높은 신뢰성을 보유한다고 판단되며, 파괴모드, 축력비 유무
등 여러 조건에 관계없이 기존의 경험식 모델을 보완하거나 대체할 수 있는 유효한 수단이 될 수 있을 것으로 기대된다.
본 연구에서 사용한 데이터는 더욱 확보될 경우 다양성 및 규모가 더해질 것이다. 그리고 본 연구에서 사용한 입력 변수와 출력 변수 간의 관계를 명확하게
검증하지 않았다. 추후 연구에서 더 다양한 실험체 데이터를 확보하여 학습에 활용한다면 예측 성능을 더욱 향상시킬 수 있을 것이다. 또한, 입력변수
중요도 분석 방법을 사용하여 입출력 변수의 관계를 검증할 것이다. 그리고 본 연구에서 사용한 데이터의 이력변수들의 범위 밖의 값을 사용할 경우 주의가
필요하다.
감사의 글
본 연구는 행정안전부 과제 (B0080901000971)지원하에 수행된 것임.
References
ACI Committee 369 (2011) Guide for Seismic Rehabilitation of Existing Concrete Frame
Buildings and Commentary (ACI 369R-11). Farmington Hills, MI: American Concrete Institute
(ACI).

ASCE (2023) Seismic Evaluation and Retrofit of Existing Buildings (ASCE/SEI 41-23).
Reston, VA; American Society of Civil Engineers (ASCE).

Cardone, D., and Perrone, G. (2017) Damage and Loss Assessment of Pre-70 RC Frame
Buildings with FEMA P-58. Journal of Earthquake Engineering 21(1), 23-61. (In Korean)

Chen, T., and Guestrin, C. (2016) Xgboost: A Scalable Tree Boosting System. KDD '16:
Proceedings of the 22nd ACM SIGKDD International Conference on Knowledge Discovery
and Data Mining. 785-794.

Elwood, K. J., and Moehle, J. P. (2005) Drift Capacity of Reinforced Concrete Columns
with Light Transverse Reinforcement. Earthquake Spectra 21(1), 71-89.

Erduran, E. (2012) Evaluation of Rayleigh Damping and Its Influence on Engineering
Demand Parameter Estimates. Earthquake Engineering & Structural Dynamics 41(14), 1905-1919.

FEMA (2018) Seismic Performance Assessment of Buildings, Volume 1: Methodology. Second
Edition (FEMA P-58-1). Washington, D.C.; Federal Emergency Management Agency (FEMA).

Ghannoum, W. M., and Sivaramakrishnan, B. (2012) ACI 369 Rectangular Column Database.
Network for Earthquake Engineering Simulation. DOI: https://doi.org/10.4231/D366 88J50

Gogus, A., and Wallace, J. W. (2015) Seismic Safety Evaluation of Reinforced Concrete
Walls through FEMA P695 Methodology. Journal of Structural Engineering 141(10), 04015002.

Goksu, C. (2021) Fragility Functions for Reinforced Concrete Columns Incorporating
Recycled Aggregates. Engineering Structures 233, 111908.

Guo, A., Liu, Z., Li, S., and Li, H. (2017) Seismic Performance Assessment of Highway
Bridge Networks Considering Post-Disaster Traffic Demand of a Transportation System
in Emergency Conditions. Structure and Infrastructure Engineering 13(12), 1523-1537.

Ha, S. J., and Han, S. W. (2016a) A Method for Selecting Ground Motions that Considers
Target Response Spectrum Mean and Variance as Well as Correlation Structure. Journal
of Earthquake Engineering 20(8), 1263–1277.

Ha, S. J., and Han, S. W. (2016b) An Efficient Method for Selecting and Scaling Ground
Motions Matching Target Response Spectrum Mean and Variance. Earthquake Engineering
and Structural Dynamics 45(8), 1381-1387.

Ribeiro, M. H. D. M., and dos Santos Coelho, L. (2020) Ensemble Approach Based on
Bagging, Boosting and Stacking for Short-Term Prediction in Agribusiness Time Series.
Applied Soft Computing 86, 105837.

Siddique, R., Aggarwal, P., and Aggarwal, Y. (2011) Prediction of Compressive Strength
of Self-Compacting Concrete Containing Bottom Ash using Artificial Neural Networks.
Advances in Engineering Software 42(10), 780-786.

Xie, Y., Ebad Sichani, M., Padgett, J. E., and DesRoches, R. (2020) The Promise of
Implementing Machine Learning in Earthquake Engineering: A State-of-the-Art Review.
Earthquake Spectra 36(4), 1769-1801.

Zhang, W., Wu, C., Zhong, H., Li, Y., and Wang, L. (2021) Prediction of Undrained
Shear Strength using Extreme Gradient Boosting and Random Forest Based on Bayesian
Optimization. Geoscience Frontiers 12(1), 469-477.
