Mobile QR Code QR CODE
Export citation EndNote

  1. 경상국립대학교 건축공학과 박사과정 (Graduate Student, Department of Architectural Engineering, Gyeongsang National University, Jinju 52828, Rep. of Korea)
  2. 경상국립대학교 건축공학과 석사과정 (Graduate Student, Department of Architectural Engineering, Gyeongsang National University, Jinju 52828, Rep. of Korea)
  3. 경상국립대학교 건축공학과 부교수 (Associate Professor, Department of Architectural Engineering, Gyeongsang National University, Jinju 52828, Rep. of Korea)



레올로지, 콘크리트, 머신러닝, 인공신경망
rheology, concrete, machine learning, artificial neural network

1. 서 론

콘크리트는 다양한 재료들로 구성된 복잡한 혼합물로서 콘크리트를 구성하고 있는 결합재들의 상호작용과 재료들의 비율에 따라 각기 다른 물성을 갖는다(Ferraris et al. 2001; Seo et al. 2009). 그중 콘크리트의 유동성은 시공용이성, 재료분리 저항성, 펌프압송성 등 콘크리트의 다른 특성과 연관이 있다고 알려진 물성으로 콘크리트의 중요한 물성 중 하나이다. 일반적으로 건설 현장에서 콘크리트의 유동성을 평가하기 위해 슬럼프, 슬럼프 플로 측정 등과 같은 방법들을 사용하고 있다. 이러한 방법은 시험 절차가 쉽고 간편하여 많이 사용되고 있지만, 실험자의 경험과 숙련도에 따라 결과 값이 달라질 수 있어 콘크리트의 유동성을 정확히 평가하기에는 한계가 있다(Seo et al. 2009; Kwon et al. 2013). 이러한 측면에서 굳지 않은 콘크리트의 유동성을 정량적이고 과학적으로 평가할 수 있는 방법의 필요성이 대두되었고 그에 따른 기술적 요구에 따라 레올로지를 이용한 방법이 제시되었다(Powers 1968; Tattersall 1991; Seo et al. 2009; Lee et al. 2018).

레올로지는 물질의 유동과 변형에 대한 학문으로 고체와 유체의 특성을 동시에 갖는 현탁액과 같은 물질의 흐름과 변화를 다루는 분야이다(Tattersall and Banfill 1983). 굳지 않은 콘크리트는 여러 재료가 물에 혼합되어 있는 현탁액으로 볼 수 있으며, 이러한 시멘트계 현탁액의 유동성은 비뉴턴유체로 가정하여 Bingham 모델을 통해 표현하고 있다(Roussel and Roy 2005; Hyeon 2007). Bingham 유체로 가정한 콘크리트는 레오미터를 이용하여 항복응력(Yield Stress)과 소성점도(plastic viscosity)와 같은 레올로지 정수를 측정하여 정량적으로 유동성을 평가할 수 있다(Seo et al. 2009; Kim and Shin 2018). 최근 콘크리트의 정성적 유동성 평가 방법인 슬럼프, 슬럼프 플로와 정량적 유동성 평가 방법인 레올로지 정수의 상관관계에 대한 연구가 많이 진행되었으며(Saak et al. 2003; Roussel 2006), 레올로지 정수 중 항복응력이 콘크리트의 유동성과 관련이 있다고 알려져 있다. 하지만 레올로지 정수 측정은 정량적이고 과학적으로 콘크리트의 유동 성능에 대한 정의와 평가를 할 수 있지만, 고가의 장비와 많은 양의 콘크리트 샘플이 필요하고 복잡한 시험 방법으로 건설 현장에 직접 적용하기가 어려운 상황이다(Roussel 2006; Hyun 2007; Shin et al. 2017).

건설 산업에서는 최근 4차 산업혁명의 시대를 맞이함에 따라 새로운 기술을 받아들이고 적용하고자 하는 노력을 하고 있다(Ahn and Kim 2017). 4차 산업혁명으로 건설 산업은 사물 인터넷, AI(인공지능), 3D 프린팅, BIM(building information modeling) 등 이전보다 더 발전된 기술들을 통해 생산성을 높이고 효과적인 프로젝트 관리를 통해 높은 품질 및 안전을 확보할 수 있다(Um 2017). 그중에서 머신러닝, 인공신경망(artificial neural network, ANN)과 같은 여러 인공지능 기법을 이용하여 콘크리트의 물성을 예측하여 효율적으로 콘크리트의 품질을 관리, 평가하고자 하기 위한 연구들이 진행되고 있다. 인공지능 기법 중 머신러닝은 알고리즘을 이용하여 인간의 학습 능력과 같은 기능을 컴퓨터에 부여하기 위한 기술로서 인공지능 신경망을 기반으로 데이터를 분석하고, 분석 결과를 스스로 학습한 후 어떠한 판단이나 예측하는 머신러닝 방법론 중 하나를 딥러닝이라고 한다(Samuel 1959; Bengio 2013; Jurgen 2014). 하지만 현재 인공지능 기법을 활용한 콘크리트의 물성 예측과 관련된 연구들은 주로 경화 콘크리트의 특성을 예측, 평가하는 것에 중점을 두고 있으며(Kim et al. 2002; Lee 2019; Jeong 2020; Jeon et al. 2021; Kwon and Yoon 2022) 머신러닝을 기반으로 하는 굳지 않은 콘크리트의 물성 예측에 관한 연구는 부족하다고 할 수 있다.

머신러닝 알고리즘 중 가장 많이 사용되는 방식은 이미 알려진 사례를 기반으로 학습한 일반화된 모델을 만들어 의사 결정 프로세스를 자동화하는 방식이다. 사용자가 알고리즘에 원하는 입력과 출력값을 모델에 제공하면 알고리즘이 학습하여 원하는 출력을 도출하도록 한다. 이렇게 학습된 알고리즘은 새로운 입력값이 주어졌을 때 적절한 출력을 만들어 낼 수 있다. 머신러닝 알고리즘을 기반으로 하여 데이터를 예측하고자 할 때 중요한 것은 충분한 학습을 위한 많은 양의 데이터가 필요하다는 것과 예측 모델의 여러 가지 학습 parameter가 사용하는 데이터에 적합한 지 분석이 필요하다는 것이다.

따라서 본 연구는 머신러닝 알고리즘을 기반으로 하여 과학적이고 정량적인 굳지 않은 콘크리트의 유동성 평가 방법인 레올로지 정수를 더 쉽고 효율적으로 활용하기 위해 재래적 방식의 유동성 평가 데이터인 콘크리트 슬럼프 플로 데이터를 통해 레올로지 정수를 예측하는 것을 목표로 진행되었으며, 데이터 전처리 과정과 학습에 사용된 데이터의 개수와 품질이 예측 모델의 성능에 미치는 영향에 대해 분석하고자 한다. 이러한 예측 모델의 개발은 향후 건설 현장에서 직접적인 레올로지 정수 측정 없이도 굳지 않은 콘크리트의 정량적 유동성 평가에 기여할 것으로 판단된다.

2. 머신러닝에 대한 이론적 고찰

2.1 머신러닝의 개념

머신러닝(machine learning)은 Fig. 1에 도식화한 것과 같이 사용자가 명시적으로 프로그래밍하지 않고도 컴퓨터가 데이터를 통해 학습하여 문제를 개선, 해결할 수 있는 시스템을 개발하는 인공지능 분야로 기계가 데이터를 학습하고, 패턴을 식별하여 해당 학습을 기반으로 예측 또는 결정을 내릴 수 있도록 하는 것을 목표로 하는 인공지능 기술이다(Francois 2022). 머신러닝은 많은 양의 데이터를 의미 있는 정보를 갖는 데이터로 만들어 다양한 문제 해결을 위해 적용할 수 있어 이미지 및 음성인식, 자연어 처리, 추천 시스템 및 예측 분석 등 많은 알고리즘이 다양한 분야에 활용되고 있다. 이러한 머신러닝의 프로세스에는 크게 데이터 수집, 적절한 모델 파라미터 선택, 모델 학습 및 테스트, 성능 평가의 흐름으로 진행되며 데이터 수집과 적절한 모델 파라미터 선택은 머신러닝 알고리즘의 성능에 많은 영향을 미치는 단계이다. 머신러닝에 관련된 기존 연구들을 보면 어떠한 문제를 머신러닝 기술을 활용하여 해결하려고 할 때 문제에 대하여 많은 데이터와 다양한 입력 변수를 가질 때 머신러닝 모델의 성능이 향상된다고 알려져 있다(Hinton et al. 2006). 따라서 머신러닝 기술을 활용함에 있어서 많은 양의 데이터의 수집과 적절한 데이터 전처리 작업은 머신러닝 성능 향상에 큰 영향을 미칠 수 있다(Humphrey et al. 2016).

Fig. 1 Conceptual diagram showing the positioning of artificial intelligence relative to machine learning and deep learning
../../Resources/KCI/JKCI.2024.36.1.061/fig1.png

2.2 데이터 전처리 방법

데이터 전처리는 모델 학습 결과 향상을 위해 수집한 데이터를 머신러닝 알고리즘에 적용하기 알맞은 데이터로 변환하는 과정을 말한다(Joo et al. 2000; Seong and Hong 2022). 데이터 전처리 방법에는 입력 데이터의 특성을 고려하여 값이 잘못되었다고 판단되는 결측치나 이상치, 입력 데이터와 단위나 타입이 맞지 않는 데이터인 모순, 불일치 데이터를 제외하는 작업인 Data Cleaning, 중복된 데이터를 처리하는 Data Integration, 숫자형 데이터와 같이 넓은 범위를 가질 수 있는 데이터를 학습시킬 경우 데이터의 범위나 차원을 좁혀주는 작업인 요약(summarization), 정규화(normalization), 표준화(standardization), 집합화(aggregation) 등과 같은 Data Transformation, 많은 양의 데이터를 시간 단위로 축소하는 Data Reduction과 Data Balancing 등이 있다(Garcia et al. 2016).

본 연구에서는 콘크리트 슬럼프 플로 데이터와 레올로지 정수 데이터가 갖는 특성을 고려하여 재료분리 등으로 인해 발생할 수 있는 데이터 이상치를 제거하는 Data Cleaning 방법과 비교적 전체 데이터의 분포 범위가 넓은 데이터의 특성을 고려하여 데이터의 범위를 줄여주는 Data Transformation 방법을 사용하였으며, Data Transformation 방법 중에서도 입력 데이터에 일정한 소수(0.001)를 곱하여 데이터의 분포 범위를 축소시키는 방법과 데이터 정규화 작업을 사용하였다. 데이터 전처리 작업 여부에 따라 머신러닝 알고리즘을 기반으로 한 콘크리트 슬럼프 플로 데이터를 통한 레올로지 정수 예측 모델의 성능이 어떻게 변화하는지 분석하여 데이터 전처리 과정이 모델의 성능에 미치는 영향을 알아보고자 하였다.

2.3 모델의 예측 성능 평가

본 연구에서는 데이터 전처리 과정이 예측 모델에 미치는 영향을 분석하기 위해 회귀모델의 성능 평가 지표로 사용되는 평균절대오차(mean absolute error, MAE), 평균제곱오차(mean square error, MSE)와 결정계수(R-squared)를 모델의 예측 성능을 평가하는 지표로 사용하였다.

Fig. 2 Concept of mean square error (MSE): the average of differential area between predicted data and actual data
../../Resources/KCI/JKCI.2024.36.1.061/fig2.png

MAE는 실제값과 예측값의 차이를 절댓값으로 변환하여 데이터의 개수로 나누어 평균한 것을 말한다. Error에 절댓값을 취하기 때문에 오차의 크기를 그대로 반영할 수 있으며 에러에 따른 손실이 선형적으로 올라가거나 이상치가 많은 경우 사용하기 적합한 성능 평가 지표이다.

MSE는 모델의 출력값이 제대로 예측되었는지 평가하기 위한 지표로서 손실함수로 많이 사용되는 지표 중 하나이다. 실제값과 모델이 예측한 값의 차이를 제곱하여 평균화한 값이다. MAE와는 다르게 실제값과 예측값의 차이를 제곱을 하기 때문에 Fig. 2에 나타낸 것과 같이 모델이 도출한 예측값과 실제값 차이의 면적 평균과 같다고 할 수 있다. 입력 데이터에 이상치가 존재할 경우 MSE의 수치가 증가할 수 있다.

MAE, MSE는 오차의 크기를 표현한 지표로써 값이 작을수록 모델의 성능이 뛰어나다고 평가할 수 있으며 각각의 성능 지표를 식 (1), 식 (2)를 통해 산출할 수 있다. 식 (1), 식 (2)에서 $n$은 데이터의 개수, $Y_{i}$는 입력한 데이터의 값(실제값), $\hat{Y_{i}}$는 모델이 예측한 값이다.

(1)
$MAE =\dfrac{\sum_{i=1}^{n}\vert Y_{i}-\hat{Y_{i}}\vert}{n}$
(2)
$MSE =\dfrac{1}{n}\sum_{i=1}^{n}(Y_{i}-\hat{Y_{i}})^{2}$

결정계수는 회귀 모델의 적합도를 평가하는 데 주로 사용되며 주어진 데이터로부터 종속 변수가 얼마나 많은 변동성을 가지는지를 나타낸다. 결정계수는 식 (3)을 통해 산출할 수 있으며 1에 가까울수록 모델이 데이터를 잘 설명하는 것으로 볼 수 있다.

(3)
$r^{2}=\dfrac{\Sigma(\hat{Y}-\overline{Y})^{2}}{\Sigma(Y-\overline{Y})^{2}}$

본 연구에서는 실제 레올로지 정수 데이터와 예측 모델이 도출한 레올로지 정수 예측 값을 사용하여 도출한 결정계수를 통해 예측 모델의 성능을 평가하고자 하였다.

또한 예측 모델이 일정한 수준의 성능으로 예측할 수 있는지 분석하기 위해 데이터 전처리 과정에 따른 콘크리트 슬럼프 플로 데이터를 통한 레올로지 정수 예측을 20회씩 반복하여 수행한 후 도출한 모델 성능 지표인 MAE, MSE의 최소값, 최대값, 평균값을 비교하였다.

3. 분석 계획

3.1 데이터 수집

콘크리트의 슬럼프 플로 데이터를 기반으로 콘크리트의 레올로지 정수를 예측하기 위한 예측 모델의 학습 데이터는 실험을 통해 얻은 굳지 않은 콘크리트의 유동성 평가 데이터와 머신러닝 알고리즘으로 예측한 데이터를 다시 학습 데이터로 사용하는 두 가지 방법을 통해 수집하였다.

예측 모델 작성을 위한 실험계획은 Table 1에 나타내었다. 굳지 않은 콘크리트의 유동성 평가 데이터인 슬럼프 플로 테스트 데이터와 레올로지 정수 데이터 수집을 위한 실험계획은 일반강도 콘크리트의 배합 범위에서 진행하였으며 예측 모델 학습에 사용한 데이터의 개수는 667개이다. 또한 학습하는 데이터의 수에 따라 학습한 예측 모델의 성능도 영향을 받는 머신러닝 알고리즘의 특징에 따라 많은 학습 데이터 확보를 위해 실험을 통해 수집한 슬럼프 플로 데이터를 학습하여 예측한 레올로지 정수 데이터를 다시 학습 데이터로 사용하여 학습 데이터의 개수가 예측 성능에 어떠한 영향을 주는지에 대해 분석하였다. 데이터 전처리에 따른 예측 모델의 성능 분석과 학습 데이터의 품질 및 개수에 따른 예측 모델의 성능 분석을 위해 사용된 학습 데이터의 개수는 Table 2와 같다. 머신러닝 알고리즘 기반의 예측 모델의 학습을 위해 입력한 전체 데이터의 70 %는 모델의 학습을 위한 Train Set에 사용하였고 30 %는 모델의 성능 평가를 위한 Test Set에 사용하였다. 모델의 테스트를 위해 전체 학습 데이터의 30 %를 나눈 Test Set의 20 %는 예측 모델의 학습 중 주기적으로 모델의 성능을 평가하고 최적의 모델을 선택하기 위한 Validation Set으로 사용하였으며 이러한 데이터 셋의 비율은 Fig. 3과 같다. 예측 모델에 입력한 학습 데이터는 지정한 비율에 따라 무작위로 선택하여 Train Set, Test Set, Validation Set으로 나누었다.

Table 1 Experiment plan for data collection

W

(kg/m3)

W/C

S/a

SP

(%)

Elapsed time

(m)

175

180

185

195

0.35

0.40

0.45

0.50

0.55

0.60

0.40

0.45

0.50

0

0.25

0.50

0.75

1.00

0 15 30 45 60

Notes: W: unit water; W/C: water-to-cement ratio; S/a: fine aggregate ratio; SP: superplasticizer.
Table 2 Number of data points used to train the rheology constant prediction model

Prediction performance analysis according to data preprocessing of training data

Non-preprocessing

Data cleaning

Summarization

Normalization

DC+S

DC+N

DC+N+S

667

625

Prediction performance analysis according to quality of training data

Non ($R^{2}$ 0.29)

DC ($R^{2}$ 0.53)

$R^{2}$ 0.60

$R^{2}$ 0.65

$R^{2}$ 0.70

$R^{2}$ 0.75

$R^{2}$ 0.80

$R^{2}$ 0.85

667

625

584

560

522

488

443

378

Prediction performance analysis of models using predicted data by models with different R-squared of training data

$R^{2}$ 0.60

$R^{2}$ 0.65

$R^{2}$ 0.70

$R^{2}$ 0.75

$R^{2}$ 0.80

$R^{2}$ 0.85

1,640

1,735

1,620

1,665

1,507

1,405

Notes: DC: data cleaning; N: normalization; S: summarization; Non: non-preprocessing.
Fig. 3 Concept of mean square error (MSE): the average of differential area between predicted data and actual data
../../Resources/KCI/JKCI.2024.36.1.061/fig3.png

3.2 예측 모델 알고리즘

콘크리트의 슬럼프 플로 데이터를 기반으로 레올로지 정수를 예측하기 위해 본 연구에서 사용한 머신러닝 알고리즘은 인공 신경망(artificial neural network, ANN)의 한 유형인 다층 신경망(multilayer perceptron, MLP)이다. 다층 신경망은 여러 개의 은닉층으로 구성된 인공 신경망 구조를 말한다. 다층 신경망은 기계 학습과 딥러닝 분야에서 주로 사용되고 있으며 더 깊은 신경망을 구성할수록 더 복잡한 문제를 다룰 수 있고 기계 학습 모델의 성능에도 영향을 줄 수 있다(Seong and Hong 2022). 본 연구에서 사용한 다층 신경망 모델의 세부 조건은 Table 3과 같다. 본 연구에서는 입력 데이터를 활용한 효율적인 모델의 학습을 위해 전체 학습 데이터를 16개의 배치로 나누어 학습시키는 확률적 경사 하강법을 적용하였으며 이에 따른 Optimizer는 Adam으로 설정하였다. 오차 함수는 MAPE(mean absolute percentage error rate)를 사용하였다. 전체 데이터의 학습 횟수는 1,000으로 설정하였고 각 레이어의 노드 개수는 512, 256, 128, 64, 32, 1로 감소시켰으며 모델의 과적합을 방지하기 위해 50 %의 뉴런이 무작위로 비활성화 되도록 Dropout을 적용하였다.

Table 3 Detailed conditions of multilayer perceptron model

Activation

function

Optimizer

Hidden layer

Batch size

Epochs

ELU

Adam

4

16

1,000

4. 결과분석

4.1 실험 결과 분석

콘크리트의 슬럼프 플로 데이터를 바탕으로 하는 레올로지 정수 예측 모델 작성에 입력할 데이터 수집을 위해 Table 1과 같은 실험을 진행하여 얻은 데이터를 Fig. 4Fig. 5에 나타내었다. 먼저 Fig. 4에 나타낸 콘크리트 슬럼프 플로 시험 결과를 보면 단위수량과 물시멘트비, 감수제 첨가량이 증가할수록 슬럼프 플로가 전체적으로 증가하고 있음을 알 수 있다.

Fig. 5에 나타낸 콘크리트의 레올로지 정수 중 정적 항복응력 측정 결과를 보면 슬럼프 플로 시험 결과와 유사하게 단위수량, 물시멘트비, 감수제 첨가량이 증가할수록 항복응력이 감소하였다. 다만, 높은 단위 수량, 물시멘트비를 갖는 콘크리트 배합에서 감수제 첨가량이 많아질 경우 항복응력이 감소하지 않고 증가하는 것을 확인할 수 있는데 이러한 결과는 육안으로 판단할 수 없었던 콘크리트의 재료분리 경계 또는 재료분리로 인해 정상적인 레올로지 측정이 불가능하여 나타난 결과로 판단된다(Lee et al. 2020). 이러한 실험을 통해 굳지 않은 콘크리트의 슬럼프 플로 데이터와 레올로지 정수 데이터를 수집하였으며, 수집한 667개의 데이터 중 EIS, 배합 요소, 슬럼프 플로, 레올로지 정수 변화 경향 등을 통해 재료분리 경계 또는 재료분리로 판단된 데이터들은 전처리 과정인 Data Cleaning 작업을 통해 제외하였다.

Fig. 4 Slump flow test results according to mixing factors
../../Resources/KCI/JKCI.2024.36.1.061/fig4-1.png../../Resources/KCI/JKCI.2024.36.1.061/fig4-2.png
Fig. 5 Static yield stress according to mixing factors
../../Resources/KCI/JKCI.2024.36.1.061/fig5-1.png../../Resources/KCI/JKCI.2024.36.1.061/fig5-2.png

4.2 데이터 전처리 과정이 예측 모델에 미치는 영향

데이터 전처리 과정이 머신 러닝 알고리즘 기반의 예측 모델 성능에 미치는 영향을 분석하기 위하여 데이터 전처리 과정에 따른 콘크리트 슬럼프 플로 데이터를 통한 레올로지 정수 예측 모델의 성능을 비교 분석하였으며 전처리 과정에 따른 모델의 분류는 Table 4와 같다.

Table 4 Classification of predictive models for data preprocessing

Data cleaning

Summarization

Normalization

Case 1

×

×

×

Case 2

×

×

Case 3

×

×

Case 4

×

×

Case 5

×

Case 6

×

Case 7

Fig. 6은 데이터 전처리에 따른 굳지 않은 콘크리트의 레올로지 정수를 예측하는 모델의 성능을 MAE 지표를 통해 평가한 결과를 도식화한 것이다. Case 1과 Case 2를 비교하였을 때 Data Cleaning 작업을 진행함에 따라 모델의 예측 성능이 소폭 개선되는 것으로 판단된다. 특히 데이터 전처리 기법 중 Data Transformation 전처리 여부에 따라 MAE 지표가 차이가 큰 것을 확인할 수 있었다. Data Transformation 기법과 Data Cleaning 기법을 함께 적용한 Case 3, 4, 5, 6, 7의 경우 모델의 성능이 크게 개선되었으며 그중에서도 Data Normalization 기법과 Data Cleaning 기법을 함께 적용한 Case 6에서 가장 우수한 성능을 가지는 것으로 판단된다. 두 가지 데이터 전처리 기법을 함께 적용한 모델에서 MAE 지표의 최솟값, 최댓값, 평균값의 차이가 감소하는 것을 볼 수 있는데, 이는 적절한 데이터 전처리 과정 수행이 예측 모델의 균일한 수준의 결과 도출에 영향을 준 결과로 판단된다. 다만 Data Cleaning, Summarization, Normalization 세 가지 전처리 기법을 모두 적용할 때 모델의 성능이 소폭 감소하였다.

Fig. 7은 데이터 전처리에 따른 굳지 않은 콘크리트의 레올로지 정수를 예측하는 모델의 성능을 MSE 지표를 통해 평가한 결과를 도식화한 것이다. MSE 지표를 통한 모델의 성능 평가 또한 유사한 결과를 나타내는 것을 알 수 있다. MSE 지표를 통한 모델의 성능 평가 결과 Data Transformation 전처리 여부에 따라 예측 모델의 성능이 크게 개선되었으며 Data Transformation 기법과 Data Cleaning 기법을 함께 적용하였을 때 예측 모델의 성능 개선 효과가 큰 것을 알 수 있다. 그중에서도 Normalization과 Data Cleaning을 함께 적용한 Case 6의 성능이 가장 우수한 것으로 평가되었다.

Fig. 8은 데이터 전처리에 따른 굳지 않은 콘크리트의 레올로지 정수를 예측하는 모델의 예측 결과와 실제 굳지 않은 콘크리트의 레올로지 정수 데이터와 모델이 예측한 레올로지 정수 데이터 사이의 결정계수와 모델의 예측값과 실제값의 관계를 도식화한 것이다. 실제 콘크리트의 레올로지 정수 데이터와 모델이 예측한 레올로지 정수 데이터 사이의 결정계수가 클수록 모델이 더 정확하게 예측한 것으로 판단하였다.

결정계수를 통한 모델의 성능 평가 결과는 MAE, MSE를 통해 평가한 결과와 다른 결과를 나타내는 것을 알 수 있었다. Case 1의 경우 MAE, MSE 지표는 매우 큰 값을 가졌으나 결정계수는 상대적으로 높은 값을 가지는 알 수 있다. MAE와 MSE의 값이 큰 것은 모델이 예측을 정확하게 하지 못하여 실제 값과 예측값의 오차가 크게 발생하는 것으로 예측 정확도가 떨어지는 것을 의미한다. 반면 결정계수는 모델이 종속 변수의 변동성을 얼마나 잘 설명하는지를 나타내는 지표로 값이 클수록 모델이 데이터를 잘 설명한다는 것을 의미한다. 그러나 Case 1처럼 결정계수가 높더라도 MAE와 MSE가 크다면 모델이 정확하게 예측하지 못하고 있다고 판단할 수 있다. 또한 Case 1의 경우 결정계수의 최솟값, 최댓값, 평균값의 차이가 크게 나타나고 있는데 이는 모델이 여러 차례 반복해서 학습할 때마다 예측 성능이 달라지는 것을 의미한다. Case 1은 어떠한 전처리도 이루어지지 않은 경우로 학습에 사용된 데이터에 이상치가 많이 포함되어 나타난 결과로 판단된다.

Fig. 6 Model performance evaluation by mean absolute error (MAE) according to data preprocessing
../../Resources/KCI/JKCI.2024.36.1.061/fig6.png
Fig. 7 Model performance evaluation by mean square error (MSE) according to data preprocessing
../../Resources/KCI/JKCI.2024.36.1.061/fig7.png
Fig. 8 Model performance evaluation by R-squared and prediction results for data preprocessing
../../Resources/KCI/JKCI.2024.36.1.061/fig8-1.png../../Resources/KCI/JKCI.2024.36.1.061/fig8-2.png
Fig. 9 Loss according to epoch in Case 2 (data cleaning)
../../Resources/KCI/JKCI.2024.36.1.061/fig9.png

Case 2 또한 Case 1과 같이 MAE와 MSE는 크고 결정계수의 경우 상대적으로 높으며 결정계수의 최솟값, 최댓값, 평균값의 차이가 크게 나타나고 있다. MAE와 MSE를 통한 성능 평가 결과 Data Transformation 처리를 한 Case에서 성능 평가 지표들이 크게 개선되는 것으로 보아 Data Cleaning을 통해 이상치를 제거하였으나 학습에 사용된 데이터의 분포가 상대적으로 크기 때문에 결정계수는 감소한 것으로 사료된다.

Fig. 9는 Case 2의 학습 반복 횟수에 따른 오차를 나타낸 것이다. Case 2의 경우 학습을 반복할수록 학습 데이터의 오차는 줄어들지만 테스트 데이터의 오차는 감소하다 다시 증가하여 학습 데이터의 오차보다 커지는 것을 알 수 있다. 이러한 결과는 과적합(overfitting)이 발생한 것으로 과적합이 발생하는 경우 학습 데이터에서는 정확한 예측이 가능하지만 새로운 데이터(test dataset)를 입력할 때 예측 성능이 떨어지게 된다. 과적합은 정규화 기법과 같이 모델에 입력한 학습 데이터를 적절하게 가공하는 것으로도 개선할 수 있다고 알려져 있다. Data Transformation을 함께 적용한 Case 5, 6, 7에서 결정계수가 증가하고 결정계수의 최솟값, 최댓값, 평균값의 차이도 감소하는 것도 입력 데이터의 가공을 통해 모델의 예측 성능이 개선된 결과로 판단된다.

Case 3과 Case 4의 경우 MSE와 MAE는 감소하였으나 결정계수 또한 감소하고 있는 것을 알 수 있다. MAE와 MSE가 작은 것은 모델이 예측한 값과 실제 값의 오차가 작은 것을 의미하지만, 결정계수가 작다는 것은 모델의 데이터 설명력이 낮다는 것으로 모델의 예측이 부정확하거나 데이터를 잘 설명하지 못하고 있다는 것을 의미한다. 따라서 MAE와 MSE가 작지만 결정계수가 작은 Case 3, 4의 경우 모델의 성능이 여전히 부족한 것으로 판단된다.

Data Transformation과 Data Cleaning을 함께 적용한 Case 5, 6, 7의 경우 MSE와 MAE도 감소하였고 결정계수 또한 증가한 것을 알 수 있다. 또한 모델이 예측한 값과 실제 값을 그림으로 도식화하였을 때 데이터의 오차가 감소하고 데이터의 분포도 좁아진 것을 알 수 있다. 이는 데이터 전처리가 머신러닝 알고리즘 기반의 예측 모델 성능에 많은 영향을 주며 이상치 제거와 적절한 데이터 가공이 함께 이루어질 때 모델의 성능을 개선할 수 있을 것으로 판단된다.

4.3 학습 데이터가 예측 모델의 성능에 미치는 영향

앞서 데이터 전처리가 예측 모델의 성능에 미치는 영향을 분석하였을 때 이상치 제거와 데이터 가공이 모델의 예측 성능 개선에 도움을 주는 것으로 판단하였고 이에 따라 머신러닝 알고리즘을 기반으로 하는 예측 모델에서 학습 데이터가 예측 모델의 성능에 미치는 영향을 분석하기 위해 학습 데이터의 결정계수에 따른 예측 결과를 분석하였다.

Fig. 10은 결정계수를 기준으로 이상치를 제거한 학습 데이터를 나타낸 것이다. 결정계수에 대한 절대적인 평가 기준은 없으나 공학 분야에서는 결정계수가 0.7 이상일 때 높은 설명력을 가지는 것을 의미한다(Cohen 1988; Kim et al. 2022). 재료분리 등에 의한 이상치를 제거한 학습 데이터에서 데이터의 분포를 좁혀 결정계수를 높인 데이터를 학습 데이터로 사용하였을 때의 예측 성능을 분석하고자 하였다. 이 때 데이터를 이상치로 판단하여 제거하기 위해 Fig. 10(a)와 같이 전체 데이터 분포의 범위에서 벗어나는 데이터가 무엇인지 파악한 후 각각의 데이터의 분포가 범위 밖으로 벗어나는 이유를 배합요소, EIS, 데이터의 경향성 변화 등을 근거로 재료분리로 판단되거나 동일한 배합의 다른 데이터와 비교하여 결괏값이 크게 차이가 나 실험적 오차로 판단되는 경우 제거하였다.

예측 모델에 입력한 학습 데이터의 결정계수에 따른 예측 모델의 성능 평가 결과를 Fig. 11에 나타내었다. 학습 데이터의 결정계수가 높아질수록 예측 모델의 성능 지표 또한 개선되는 것을 알 수 있었다. 결정계수가 증가함에 따라 MAE, MSE 지표는 감소하고 모델이 예측한 예측값과 실제값 사이의 결정계수는 증가하는 것으로 보아 예측 모델의 학습 데이터의 품질이 예측 성능에 영향을 미치는 것으로 판단된다. 다만, 학습 데이터의 결정계수가 0.85일 때 예측 모델의 성능 지표 최솟값, 최댓값, 평균값의 차이가 감소하다 다시 증가하는 것을 볼 수 있는데 이는 학습 데이터의 결정계수를 높이기 위해 과도하게 데이터를 삭제하여 나타난 결과로 사료된다.

Fig. 10 Training data according to R-squared
../../Resources/KCI/JKCI.2024.36.1.061/fig10.png
Fig. 11 Performance evaluation results of the prediction model according to R-squared of the learning data
../../Resources/KCI/JKCI.2024.36.1.061/fig11.png
Fig. 12 Predictive performance evaluation results of the model learned using the model’s predicted data
../../Resources/KCI/JKCI.2024.36.1.061/fig12.png
Fig. 13 Prediction results when the data predicted by the model are used as training data
../../Resources/KCI/JKCI.2024.36.1.061/fig13.png

Fig. 11Fig. 10과 같이 입력 데이터의 R-squared를 다르게 하였을 때 예측 모델의 성능을 MAE, MSE, 모델이 예측한 예측값과 실제값 사이의 결정계수를 통해 평가한 결과를 나타낸 것이다. 학습 데이터의 결정계수 변화에 따른 예측 모델의 성능 평가 결과를 나타낸 Fig. 11과 비교하였을 때 예측 모델이 예측한 값을 다시 학습 데이터로 사용한 모델의 예측 성능이 더 높게 평가되는 것을 알 수 있었다. 이는 학습 데이터의 개수가 증가한 것에 영향을 받은 것으로 판단되며 모델이 예측한 값의 정확도가 높아 다시 학습 데이터로 제공하였음에도 성능이 저하되지 않고 개선된 것으로 사료된다. Fig. 12는 모델이 예측한 결괏값을 다시 학습 데이터로 사용하였을 때의 예측 모델의 성능을 MAE, MSE, 모델이 예측한 예측값과 실제값 사이의 결정계수를 통해 평가한 결과를 나타낸 것이다. 학습 데이터의 결정계수 변화에 따른 예측 모델의 성능 평가 결과를 나타낸 Fig. 11과 비교하였을 때 예측 모델이 예측한 값을 다시 학습 데이터로 사용한 모델의 예측 성능이 더 높게 평가되는 것을 알 수 있었다. 이는 학습 데이터의 개수가 증가한 것에 영향을 받은 것으로 판단되며 또한 모델이 예측한 값의 정확도가 높았기 때문에 다시 학습 데이터로 제공하였음에도 성능이 저하되지 않고 개선된 것으로 사료된다. Fig. 13은 모델이 예측한 결괏값을 다시 학습 데이터로 사용하였을 때 모델이 예측한 결괏값과 실제값을 도식화한 그림이다. 모델이 학습할 때 사용한 데이터의 결정계수가 높을수록 모델이 예측한 값을 다시 학습 데이터로 활용하였을 때 예측 정확도가 높아지는 것을 알 수 있었다. Fig. 10Fig. 13을 통해 학습 데이터의 결정계수가 커질수록 그리고 학습 데이터의 개수가 증가할수록 모델이 예측한 값의 분포가 좁아지는 것을 확인하였다. 위의 분석 결과들을 통해 머신러닝 알고리즘을 기반의 굳지 않은 콘크리트의 레올로지 정수 예측 모델에서 학습 데이터의 적절한 전처리 작업과 가공, 그리고 학습 데이터의 품질이 모델의 예측 성능에 많은 영향을 주는 것으로 분석하였다.

5. 결 론

본 연구에서는 머신러닝 알고리즘을 이용한 콘크리트 슬럼프 플로를 통한 콘크리트 레올로지 정수 예측 모델 개발을 위해 학습 데이터의 전처리 과정과 학습 데이터의 품질 및 개수가 예측 모델의 성능에 미치는 영향에 대해 분석하였다. 연구 결과 데이터 전처리 과정은 머신러닝 알고리즘을 기반으로 하는 예측 모델의 성능에 중요한 영향을 미치는 것을 알 수 있었으며 데이터 전처리 방법 중 Input Data를 모델링에 적합한 형태로 변환시키는 Data Normalization이 예측 모델의 성능 향상 효과가 우수하다고 판단하였다. 또한 Data Normalization 방법을 적용하더라도 결측치나 이상치와 같은 오류값을 제거해주는 Data Cleaning 과정을 함께 적용한 경우 예측 모델의 성능은 더 향상되었으며 이를 통해 오류값을 제거하여 모델의 정확한 학습을 유도하는 것 또한 중요하다고 판단하였다. 다만 예측 모델이 도출한 예측 레올로지 정수와 실제 레올로지 정수를 비교하였을 때 정확도가 개선되는 경향은 보였지만 데이터의 분포가 동일한 직선 상에 분포하였다고 보기는 어렵다고 판단하였다. 데이터 전처리 과정만으로 개선하기 어려웠던 모델의 예측 성능은 학습 데이터의 품질을 높이고 개수를 증가시켜 향상시킬 수 있는 것으로 확인하였다. 모델에 입력하는 데이터 사이의 결정계수가 높을수록 모델의 예측 성능이 향상되는 것을 알 수 있으며, 높은 결정계수를 갖는 학습 데이터를 통해 얻은 예측값을 다시 학습 데이터로 재입력하였을 때에도 예측 정확도가 높아지는 것을 알 수 있었다. 이러한 결과들을 통해 굳지 않은 콘크리트의 슬럼프 플로 데이터를 기반으로 한 레올로지 정수 예측 모델 개발에 기여할 수 있을 것으로 판단된다.

감사의 글

본 연구는 2021년 한국연구재단 신진 연구 지원 사업 연구비 지원(2021R1C1C10101461261382116530102)에 의해 수행된 연구임. 이 연구는 2022년도 경상국립대학교 연구년제 연구교수 과제임.

References

1 
Ahn, Y. H., and Kim, S. Y. (2017) Construction Industry Transition with the 4th Industrial Revolution Technology. Journal of the Korea Institute of Building Construction 17(2), 18-23. (In Korean)URL
2 
Bengio. Y. A. (2013) Representation Learning: A Review and New Perspectives. IEEE Transactions on Pattern Analysis and Machine Intelligence 35(8), 1798-1828.DOI
3 
Cohen, J. (1988) Statistical Power Analysis for the Behavioral Sciences (2nd ed.). New York, NY: Routledge.URL
4 
Ferraris, C. F., Obla, K. H., and Hill, R. (2001) The Influence of Mineral Admixtures on the Rheology of Cement Paste and Concrete. Cement and Concrete Research 31(2), 245-255.DOI
5 
Francois, C. (2022) Deep Learning with Python. Seoul: Gilbut.URL
6 
Garcia, S., Ramirez-Gallego, S., Luengo, J., Benitez, J. M., and Herrera, F. (2016) Big Data Preprocessing: Methods and Prospects. Big Data Analysis 1(1), 1-22.DOI
7 
Hinton, G. E., Osindero, S., and Teh, Y. W. (2006) A Fast Learning Algorithm for Deep Belief Nets. Neural Computation 18(7), 1527-1554.DOI
8 
Humphrey, G. B., Gibbs, M. S., Dandy, G. C., and Maier, H. R. (2016) A Hybrid Approach to Monthly Streamflow Forecasting: Integrating Hydrological Model Outputs into a Bayesian Artificial Neural Network. Journal of Hydrology 540, 623-640.DOI
9 
Hyeon, C. (2007) A Useful Rheometer for Cement Paste in Field. Journal of the Architectural Institute of Korea Structure and Construction 23(6), 89-97. (In Korean)URL
10 
Jeon, J. S., Kim, H. S., and Kim, C. H. (2021) Study on Prediction of Compressive Strength of Concrete based on Aggregate Shape Features and Artificial Neural Network. Journal of the Korea Institute for Structural Maintenance and Inspection 25(5), 135-140. (In Korean)URL
11 
Jeong, D. H. (2020) A Study on Prediction of Concrete Carbonation Using Deep Learning. Master Thesis. Hanyang University.URL
12 
Joo, D. S., Choi, D. J., and Park, H. (2000) The Effects of Data Preprocessing in the Determination of Coagulant Dosing Rate. Water Research 34(13), 3295-3302. (In Korean)DOI
13 
Jurgen, S. (2014) Deep Learning in Neural Networks: An Overview. Neural Networks 61, 85-117.DOI
14 
Kim, D. G. (2022) Linear Regression with Tensorflow. Magazine of the SAREK 51(10), 74-75. (In Korean)URL
15 
Kim, I. S., Lee, J. H., Yang, D. S., and Park, S. K. (2002) Prediction on Mix Proportion Factor and Strength of Concrete Using Neural Network. Journal of the Korea Concrete Institute 14(4), 457-466. (In Korean)URL
16 
Kim, J. H., and Shin, T. Y. (2018) Rheological Properties of Concrete Estimated by the Slump Flow Test. Proceedings of the Korea Concrete Institute 30(2), 401-402. (In Korean)URL
17 
Kwon, S. H., Kim, Y. J., Lee, G. C., and Choi, Y. W. (2013) Measurements and Applications of Concrete Rheology. Magazine of the Korea Concrete Institute 25(3), 24-28. (In Korean)URL
18 
Kwon, S. J., and Yoon, Y. S. (2022) The Prediction of Durability Performance for Chloride Ingress in Fly Ash Concrete by Artificial Neural Network Algorithm. Journal of the Korea Institute for Structural Maintenance and Inspection 26(5), 127-134. (In Korean)URL
19 
Lee, H. J., Kim, W. W., and Moon, J. H. (2018) Study on Rhoelogical Properties of Mortar for the Application of 3D Printing Method. Journal of the Korean Recycled Construction Resources Institute 6(1), 16-24. (In Korean)DOI
20 
Lee, S. J., (2019) A Fundamental Study on Development the Predictive System for Compressive Strength of Concrete Based on Deep Learning Algorithms. Master Thesis. Hanyang University.URL
21 
Lee, Y. J., Lee, Y. J., and Han, D. Y. (2020) A Fundamental Research on Determining Segregation Boundary Using Rheological Parameters for 21 and 24MPa Grade of Normal Strength Concrete. Journal of the Korea Institute of Building Construction 20(5), 399-407. (In Korean)DOI
22 
Powers, T. C. (1968) The Properties of Fresh Concrete. New York: John Wiley and Sons.URL
23 
Rouseel, N., and Roy, R. L. (2005) The Marsh Cone as a Viscometer : Theoretical Analysis and Practical Limits. Materials and Structures 38, 25-30DOI
24 
Roussel, N. (2006) Correlation between Yield Stress and Slump: Comparison between Numerical Simulations and Concrete Rheometers Results. Materials and Structures 39, 501-509.DOI
25 
Saak, A. W., Jennings, H. M. and Shah, S. P. (2003) A Generalized Approach for the Determination of Yield Stress by Slump and Slump Flow. Cement and Concrete Research 34(3), 363-371.DOI
26 
Samuel, A. L. (1959) Some Studies in Machine Learning Using the Game of Checkers. IBM Journal of Research and Development 3(3), 210-229.DOI
27 
Seo, I., Lee, H. S., Park, H. G., and Kim, W. J. (2009) An Experimental Study on Correlation between Rheological Parameter of Picked Mortar and Fluidity of Concrete from 30 to 150 MPa. Journal of the Architectural Institute of Korea Structure and Construction 25(9), 93-100. (In Korean)URL
28 
Seong, N. C., and Hong, G. P. (2022) An Analysis of the Effect of the Data Preprocess on the Performance of Building Load Prediction Model Using Multilayer Neural Networks. Journal of the Korean Institute of Architectural Sustainable Environment and Building Systems 16(4), 273-284. (In Korean)URL
29 
Shin, H. S., Kim, Y. J., and Park, C. S. (2017) Influence of Data Pre-Processing on a Machine Learning Model. Proceeding of Annual Conference of the Architectural Institute of Korea 37(1), 491-492. (In Korean)URL
30 
Tattersall, G. H. (1991) Workability and Quality Control of Concrete. London: CRC Press.URL
31 
Tattersall, G. H., and Banfill, P. F. G. (1983) The Rheology of Fresh Concrete. London: Pitman Books.URL
32 
Um, S. J. (2017) 4th Industrial Revolution Technology and Construction Industry, and CM. Korean Institute Construction Engineering and Management 18(4), 3-7. (In Korean)URL