The health and working conditions of employees have become increasingly important issues in modern society. In recent years, there has been a continuous rise in problems related to the deterioration of workers’ alth, which seriously affects their safety and overall quality of life. Although existing research has investigated various factors affecting workers’ health and working conditions, there is still a lack of studies that scientifically analyze and identify key variables from the vast number of factors. This study employs the Lasso (Least Absolute Shrinkage and Selection Operator) technique to mathematically analyze the key variables influencing workers’ health status and satisfaction with their working environment. Lasso is a technique used in machine learning to identify a small number of variables that impact the dependent variable among a large set of variables, thereby reducing model complexity and improving predictive accuracy. The results of the study can be utilized in efficiently improving workers’ health and working environments by focusing on a smaller set of impactful variables.
1. 서 론
산업 현장의 근로자 건강 상태와 근로환경에 대한 문제는 최근 매우 중요한 사회적 화두로 부각되고 있다. 업무상질병 만인율은 Figure 1에 나타낸 것과 같이 2017년 4.95에서 2022년 11.47로 약 2.3배 증가했으며, 이는 근로자의 건강 상태 회복이 시급함을 시사하고 있다[1]. 업무상 질병자의 주요한 질환은 근골격계질환이 52%, 소음성 난청이 23%, 진폐가 7%, 뇌심혈관 질환이 4%를 차지한다. 특히, 근골격계질환은 사업장의 작업 및 근로환경과 밀접한 관련이 있어 근로환경에 대한 유해요인 조사 및 개선이 필요한 실정이다. 또한, 최근 몇 년간 근로자의 정신 건강 악화가 증가하고 있으며, 이는 근로자의 안전과 정신 건강을 위협하는 요인으로 떠오르고 있다. 이러한 문제들은 근로자 개인 삶의 질 저하뿐만 아니라 사회 전반의 경제적 손실로 이어질 수 있어 근로자의 건강 상태와 근로환경에 대한 종합적인 분석과 개선이 시급히 요구되고 있다[8,9].
건강 상태와 근로환경에 영향을 미치는 변수를 찾기 위한 다양한 연구가 수행되고 있으나, 방대한 변수에 대한 과학적인 분석을 통해 핵심 변수(key variable)를 찾는 연구는 아직 미흡하다. 예를 들면, Kim (2007)은 회귀 분석을 통해 소득, 직업 안정성, 근무 형태, 근무 환경 등이 직무 만족도에 영향을 주는 것으로 파악하였다[2]. Kim (2020)는 물리적, 인간공학적, 정신적 건강 위험요인이 건강 문제와 관련이 있음을 확인하였고, 특정 유해인자에 대한 노출이 건강에 부정적인 영향을 미친다고 보고하였다[3]. Lee (2017)는 근로환경이 건강 상태와 결근 일수에 미치는 영향을 분석하였고, 근무 조건, 직무 요구도, 감정 상태 등이 근로자들의 건강 문제와 연관이 있다는 결론을 도출하였다[4]. 그러나 기존 연구들은 건강 상태와 근로환경에 영향을 줄 수 있는 제한된 변수에 대해 분석한 한계점이 있다. 따라서 건강 상태와 근로환경에 영향을 미치는 핵심 변수를 찾기 위해서는 관련 다양한 변수에 대한 종합적인 분석이 필요하다. 또한, 기존 연구는 다양한 변수 중에서 핵심 변수를 선정할 때 분석자의 주관이 개입될 여지가 있어, 변수 선정 방법을 보완하기 위해 수리적 방법(mathematical approach)의 적용이 필요하다.
본 연구는 Lasso (Least Absolute Shrinkage and Selection Operator)를 활용하여 건강 상태와 근로환경 만족도에 영향을 주는 핵심 변수를 수리적으로 분석하였다. Lasso는 다차원 변수 중에서 종속 변수(dependent variable)에 핵심적으로 영향을 주는 소수의 변수를 기계 학습(machine learning)을 통해 도출하는 기법이다[5, 6]. Lasso는 종속변수와 연관성이 낮은 변수(trivial variable)를 제거하여 모델의 복잡성을 줄이고 예측 정확도를 향상시킬 수 있다. 본 연구는 6차 근로환경조사에서 파악한 방대한 변수를 대상으로 Lasso를 적용하여 근로자의 건강 상태와 근로환경 만족도에 영향을 미치는 핵심 변수를 파악하였다. 본 연구의 방법론과 결과는 근로자의 건강과 근로환경 개선을 위한 유용한 기초자료로 활용될 수 있을 것으로 기대된다.
2. 연구 방법
2.1 연구 대상 데이터
본 연구는 6차 근로환경조사([7])를 통해 확보된 데이터에서 건강상태 및 근로환경 만족도와 관련 있는 변수(총 65개; Table 1)를 선별하여 사용하였다. 6차 근로환경조사는 2020.03.18.부터 2021.06.14.까지 50,000명의 근로자를 대상으로 조사하였다. 근로환경조사에는 총 486 변수가 포함되어 있으며, 본 연구는 건강 상태 및 근로환경 만족도와 연관이 있는 작업속도, 교육훈련, 작업환경, 작업 특징, 직업만족도 등의 분야에서 선정하였다.
본 연구는 2단계 절차를 통해 선별된 데이터에서 결측치를 제거하였다. 첫째 단계는 설문 응답을 정상적으로 하지 않은 데이터(예: 모름/무응답 또는 응답 거절한 경우)를 제외(전체 데이터의 약 47%)하였다. 두 번째 단계는 본 연구에서 선정한 변수 중에서 데이터가 없는 경우 결측치로 간주하여 제거(2개 데이터)하였다. 본 연구는 이러한 데이터 정선 과정을 통해 확보된 2,724,410개(= 65개 변수 × 41,914명)의 데이터를 학습용(80%)과 평가용(20%) 집단으로 무작위로 분할하여 사용하였다.
2.2 Lasso를 활용한 중요 변수 선정법
본 연구는 Lasso를 활용하여 건강 상태와 근로환경 만족도에 유의한 영향을 미치는 중요 변수를 선정하였다. Lasso는 변수 선택과 모델 축소의 목적을 갖는 기계 학습 방법의 한 종류이다. Lasso의 목적함수(식 1)는 예측 성능을 높이기 위한 오차 최소화와 모델의 복잡성을 최소화하는 L1 규제로 구성된다. Lasso는 적용 대상에 따라 L1 규제에 대한 가중치()를 다르게 적용할 수 있다. 만약, 모델의 예측 성능을 높이는 것이 중요한 기계 학습에는 가중치를 낮게 설정하고, 반대로 모델의 복잡성을 최소화하는 것이 중요한 경우에는 가중치를 높이게 된다. 따라서 Lasso는 모델의 예측 성능과 복접성 사이의 균형(trade-off)을 고려하여 적절한 중요도 값을 선택하는 것이 중요하다.
본 연구는 Lasso의 가중치를 결정하기 위해 다양한 가중치 대안에 대한 k-fold 교차 검증(cross validation)을 수행하였다. 가중치 대안은 0에서 1까지 0.05 단위로 총 21개 조건(0, 0.05, 0.10, 0.15, 0.20, 0.25, 0.3, 0.35, 0.4, 0.45, 0.5, 0.55, 0.6, 0.65, 0.7, 0.75, 0.8, 0.85, 0.9, 0.95, 1)이 고려되었다. 본 연구의 교차 검증은 k를 10으로 설정하여 데이터를 10개의 집단으로 나누고, 각 집단의 데이터를 학습(80%)과 검증(20%)용으로 구분하여 사용하였다. 교차 검증 결과(Figure 2 참조), 가중치가 증가할수록 예측 오차(RMSE, root mean squared error)는 증가하였으나 모델의 복잡도(선정된 변수의 수)는 감소하는 것으로 나타났다. 따라서 본 연구는 예측 오차와 모델의 복잡도의 균형을 고려하여 Lasso 분석을 위한 가중치를 0.05로 설정하였다.
2.3 Lasso 분석 시스템 개발
본 연구는 Python으로 개발한 프로그램을 활용하여 건강 상태와 근로환경 만족도에 영향을 주는 유의한 중요 변수를 선정하였다. 이를 위해 6차 근로환경조사와 해당 설문의 원시자료를 활용하는 3단계 절차(데이터 전처리, 가중치 결정, 그리고 Lasso 분석)로 구성된 Python 코드를 구현하였다. 첫째 단계는 6차 근로환경조사의 원시 데이터를 불러온 후 이를 정제 및 전처리하였다. 데이터 전처리에는 결측값 제거, 이상치 제거, 변수 정규화 등이 포함되었다. 둘째 단계는 Lasso 분석을 위한 가중치를 교차 검증을 통해 선정하였다. 마지막 단계는 Lasso 분석을 통해 모델의 예측 정확도를 높이고 변수의 수를 최소화(parsimonious variable)하는 모형을 도출하였다.
3. 연구 결과
3.1 건강상태
건강상태에 대한 Lasso 모형에는 총 63개의 독립 변수(independent variable) 중에서 13개가 통계적으로 유의한 변수로 선정되었다(식 2). Lasso 모형의 예측 성능을 나타내는 (수정된 결정 계수)는 0.161으로 나타났다. Lasso 모형에 따르면, 4개의 변수가 건강상태와 음의 연관성이 있는 것으로 나타났으며, 9개의 변수가 건강상태와 양의 연관성이 있는 것으로 파악되었다.
근로환경 만족도는 작업환경과 심리적/정서적 요인에 의해 영향을 받는 것으로 파악되었다. 먼저, 심한 소음(x3)이 있거나 낮은 온도의 작업장(x5)에서 근무할 경우 근로환경 만족도가 낮아지는 것으로 분석되었다. 또한, 유해 물질의 흡입(x6)이 많거나 무거운 물건을 끌거나 옮기는 작업(x15)에서 종사할 경우 근로환경 만족도가 낮아지는 것을 나타났다. 다음으로, 일자리의 전망 및 임금의 안정성에 대한 불안감이 존재할 경우(x52-x54) 근로자의 직업 만족도가 낮아지는 것을 파악되었다. 마지막으로, 업무에 대한 열정 및 에너지 부족과(x59, x60, x62, x63) 같은 정서적/심리적 요인이 있으면 근로환경 만족도가 저하되는 것으로 분석되었다.
3.2 근로환경 만족도
근로환경 만족도에 대한 Lasso 모형에는 총 63개의 독립 변수 중에서 14개가 통계적으로 유의한 변수로 선정되었다(식 3). Lasso 모형의 예측 성능을 나타내는 는 0.175으로 나타났다. Lasso 모형에 따르면 7개의 변수가 건강상태와 음의 연관성이 있는 것으로 나타났으며, 7개의 변수가 건강상태와 양의 연관성이 있는 것으로 파악되었다.
근로환경 만족도는 작업환경과 심리적/정서적 요인에 의해 영향을 받는 것으로 파악되었다. 먼저, 심한 소음(x3)이 있거나 낮은 온도의 작업장(x5)에서 근무할 경우 근로환경 만족도가 낮아지는 것으로 분석되었다. 또한, 유해 물질의 흡입(x6)이 많거나 무거운 물건을 끌거나 옮기는 작업(x15)에서 종사할 경우 근로환경 만족도가 낮아지는 것이 나타났다. 다음으로, 일자리의 전망 및 임금의 안정성에 대한 불안감이 존재할 경우(x52-x54) 근로자의 직업 만족도가 낮아지는 것을 파악되었다. 마지막으로, 업무에 대한 열정 및 에너지 부족과(x59, x60, x62, x63) 같은 정서적/심리적 요인이 있으면 근로환경 만족도가 저하되는 것으로 분석되었다.
4. 토의 및 결론
4.1 건강상태
높은 작업 온도 및 불편한 자세와 같은 유해 요인이 있는 작업장의 근로자는 건강 상태가 나쁜 것으로 나타났다. 높은 작업 온도는 신진대사를 저해하고, 체온 조절을 어렵게 만들어 건강 상태에 악영향을 미치는 것으로 추정된다. 또한, 불편한 자세는 근로자의 근골격계에 과도한 부담을 주어 근골격계질환의 위험을 증가시키고, 전반적인 건강 상태에 부정적인 영향을 주는 것으로 해석된다. 불규칙한 근무시간 혹은 근무의 유연성이 부족할 경우, 근로자의 건강 상태가 나빠지는 경향이 있었다. 이러한 경향성은 충분한 수면을 취하기 어려워 면역력이 저하되고, 신진대사를 방해할 수 있기 때문으로 추정된다.
한편, 일자리 전망과 임금 안정성에 대한 불안감은 근로자의 직업 만족도를 낮추는 것으로 나타났다. 일자리 불확실성은 근로자의 자아 존중과 자부심을 감소시키고, 정서적 안정성을 해치며, 그로 인해 우울증과 불안을 유발하는 요인으로 작용할 수 있다. 업무에 대한 열정 부족 및 에너지 부족과 같은 정서적 및 심리적 요인들도 건강 상태에 부정적인 영향을 미치는 것으로 나타났다. 업무에 대한 열정이 부족하거나 에너지가 고갈된 근로자는 규칙적인 식사와 충분한 휴식을 취하기 어려워지고, 이는 영양 섭취 부족과 수면 부족을 초래하여 다양한 건강상의 문제를 야기할 수 있다.
본 연구를 통해 도출된 건강 상태에 영향을 미치는 요인은 기존 연구에서 부분적으로 밝혀진 것과 일치하는 것으로 나타났다. Choi and Jung (2019)은 제조업에서 근로자의 직무 스트레스와 피로도가 높으면 건강 문제가 발생할 확률이 증가한다고 보고하였다[10]. 또한, 물리적 환경과 직무 요구도와 같은 요소가 건강 문제를 악화시키는 요인으로 작용한다고 지목하였다. 한편, Kim et al. (2019)은 의료 종사자들의 긴 근무 시간과 높은 업무 강도가 직무 스트레스를 유발한다고 보고하였다[11]. 이러한 기존 연구의 결과는 건강 상태에 영향을 미치는 요인을 부분적으로 밝혔으나, 본 연구는 건강 상태에 영향을 줄 수 있는 다양한 요인을 종합적으로 규명하고 그 영향의 정도를 분석하였다는 측면에서 차별화될 수 있다.
4.2 근로환경 만족도
소음이 심한 작업 환경에서는 근로자의 근로환경 만족도가 낮은 것으로 나타났다. 소음이 심한 환경은 의사소통이 어렵고, 이는 업무 협력과 효율성을 저하시킬 수 있다. 근로자들 간의 의사소통 부재는 직장 분위기와 근로환경에 대한 전반적인 만족도를 낮추는 요인으로 작용할 수 있다. 또한, 심한 소음이 발생하는 작업 환경에 장기간 노출될 경우 청력 장애와 같은 질환에 발생할 수 있어 소음 환경에 대한 근로자의 만족도가 낮은 것으로 추정된다.
실내외를 불문하고 너무 낮은 온도는 근로자의 근로환경 만족도를 저하시키는 것으로 나타났다. 추운 환경에서 근무하는 것은 근로자들에게 큰 불편함을 초래하며, 몸이 차가워지고 손과 발이 결리면서 업무 수행에 집중하기 어려워진다. 이러한 불편한 상태는 근로자들에게 불안감을 조성하고 근로자 안전 및 작업의 효율성을 저하시킬 수 있다. 유해 물질의 흡입이 많거나 무거운 물건을 끌거나 옮기는 작업이 많은 경우에도 근로자들의 근로환경 만족도가 낮은 것으로 분석되었다.
유해 물질의 흡입은 근로자들의 건강에 직접적인 위협을 줄 수 있으며, 호흡기 질환 및 알레르기 반응을 유발할 수 있다. 또한, 무거운 물건을 지속적으로 들어 옮기는 작업은 근로자들의 신체적 피로를 유발하며, 근육 및 관절에 부담을 주어 피로감을 증가시킬 수 있는 위험이 있다.
일자리 전망과 임금 안정성에 대한 불안감은 근로자의 만족도를 낮추는 것으로 나타났다. 일자리의 불안정성과 임금의 불안정성은 근로자들에게 경제적 불안을 초래하며, 이러한 불안은 근로자들이 미래에 대해 걱정하게 하여 직장에 대한 만족도를 저하시키는 것으로 추정된다. 또한, 업무에 대한 열정과 에너지 부족과 같은 정서적 및 심리적 요인들도 근로환경 만족도에 부정적인 영향을 미치는 것으로 파악되었다. 열정이나 에너지가 부족하면 근로자들의 자기 성취감이 감소하고, 업무에 대한 자신감과 열정이 부족해지면서 성취감을 느끼기 어려워진다. 이는 근로자들이 자신의 업무에 만족하는 데 어려움을 겪게 만드는 중요한 요인이 되는 것으로 추정된다.
본 연구에서 파악한 근로환경 만족도에 영향을 미치는 인자는 선행 연구에서 발견한 것과 유사한 것으로 나타났다. Lee (2017)는 소음, 고온/저온, 유해 물질과 같은 작업 환경 요인이 근로자의 주관적 건강 상태와 밀접하게 연관되어 있으며, 이러한 작업 환경에 노출될수록 근로자의 결근율과 건강 이상이 증가한다고 보고되었다[12]. Park et al. (2016)은 유해 화학 물질에 장기간 노출된 근로자들이 호흡기 질환을 비롯한 다양한 건강 문제를 더 많이 겪으며, 이는 근로환경 만족도에도 영향을 미친다고 보고하였다[13]. 이러한 선행 연구의 결과는 근로환경 만족도에 영향을 미치는 인자를 밝혔으나, 본 연구는 다양한 요인에 대한 통계적 분석을 통해 근로환경 만족도에 영향을 미치는 다양한 요인을 체계적으로 규명하였다는 측면에서 차별화된다.
본 연구의 결과에 따르면 근로자의 건강 증진을 위해서는 작업환경을 개선하고, 유해 요인을 최소화하며, 근무시간의 유연성을 보장하고, 일자리 안정성을 강화하는 등의 종합적인 접근이 필요하다. 또한, 정서적 및 심리적 지원을 통해 근로자의 업무 만족도와 에너지를 증진시키는 것이 중요하다. 한편, 본 연구의 결과에 따르면 근로환경의 물리적, 정서적 요인이 근로자의 근로환경 만족도와 직결되는 것으로 나타났다. 따라서 근로환경에 대한 근로자의 만족도 개선을 위해서는 소음 관리, 적정 온도 유지, 유해 물질 노출 감소, 물리적 작업 부담 경감, 그리고 안정적인 일자리와 임금 제공 등의 종합적인 접근이 필요하다고 사료된다. 산업 현장에서 본 연구에서 밝힌 다양한 요인에 대한 종합적이며 입체적인 개선을 위해서는 법적 및 제도적 장치 마련이 필요하며, 이를 위해서는 보다 체계적인 정책을 연구하는 추가적인 후속 연구가 필요하다고 사료된다.