제조업은 데이터가 많습니다. ERP에는 구매와 재고 데이터가, MES에는 생산 실적이, QMS에는 품질 검사 결과가 쌓입니다. 설비 센서에서는 실시간으로 온도, 압력, 진동 데이터가 들어옵니다.
하지만 이 데이터로 의사결정을 하기는 어렵습니다. "이번 달 불량률이 왜 올랐나요?"라는 질문에 답하려면, 담당자가 여러 시스템을 오가며 3일 동안 엑셀로 정리해야 합니다.
데이터는 있는데 못 씁니다. 왜 그럴까요? 이 글에서는 제조 데이터 분석이 어려운 이유와, 데이터를 제대로 활용하는 방법을 정리합니다.
데이터 사일로 - 시스템이 따로 논다
ERP, MES, QMS가 분리되어 있음
제조업에서 가장 큰 문제는 데이터 사일로입니다. ERP에는 구매와 재고 정보가, MES에는 생산 계획과 실적이, QMS에는 품질 불량 데이터가 각각 따로 저장되어 있습니다.
불량률이 올랐다고 가정해봅시다. QMS에서는 "A 제품 불량률 5% 상승"이라고 나옵니다. 하지만 왜 올랐는지는 모릅니다.
원인을 알려면 품질 데이터만으로는 부족합니다. 같은 시점에 무슨 일이 있었는지 확인해야 합니다. 설비가 정비됐나? 원자재 공급업체가 바뀌었나? 작업자 교대가 있었나? 공정 조건이 달라졌나?
연결되지 않으면 원인을 못 찾음
문제는 이 정보들이 각각 다른 시스템에 흩어져 있다는 점입니다.
설비 정비 기록은 정비 시스템에, 원자재 배치 정보는 ERP에, 작업자 교대 일정은 인사 시스템에, 공정 조건은 MES에 저장되어 있습니다.
담당자는 ERP에 들어가서 원자재 정보를 엑셀로 다운받습니다. MES에 들어가서 생산 로그를 확인합니다. 정비 시스템에서 설비 이력을 찾습니다. 이 모든 것을 시간순으로 정렬하고, 불량 발생 시점과 대조합니다.
3~5일 걸립니다. 그사이 다른 긴급 업무가 생기면? 분석은 미뤄지고, 원인은 찾지 못한 채 다음 달에도 같은 문제가 반복됩니다.
부서마다 정의가 다름
더 큰 문제도 있습니다. 공장마다, 부서마다 같은 지표를 다르게 정의합니다.
A 공장의 "불량률"은 전체 생산량 대비 불량 수량입니다. B 공장의 "불량률"은 검사한 제품 대비 불량 수량입니다. C 공장은 재작업 가능한 불량을 제외하고 계산합니다.
같은 "불량률 5%"인데, 실제 의미가 다릅니다. 공장 간 비교가 불가능합니다. 전사 차원의 의사결정을 할 수 없습니다.
데이터는 많지만, 연결되지 않고, 표준도 없습니다.
제조 데이터 분석 실패 사례
사례 1: 품질 데이터만 보다가 실패
한 전자부품 제조사에서 특정 제품의 불량률이 갑자기 올랐습니다. 품질팀은 즉시 QMS 데이터를 분석했습니다. 불량 유형, 불량 발생 시점, 검사 결과를 하나하나 뜯어봤습니다.
하지만 원인을 못 찾았습니다. 품질 데이터만 봤기 때문입니다. 불량이 언제, 어떻게 발생했는지는 알지만, 왜 발생했는지는 품질 데이터만으로는 알 수 없습니다.
3주 후에 우연히 발견했습니다. 같은 시점에 특정 부품 공급업체가 바뀌었고, 그 부품의 미세한 규격 차이가 조립 불량으로 이어진 것이었습니다.
만약 구매 데이터(ERP)와 품질 데이터(QMS)가 연결되어 있었다면? "불량률 상승 시점 = 공급업체 변경 시점"을 3일 만에 찾을 수 있었습니다.
사례 2: 설비 데이터와 생산 데이터 분리
식품 제조사에서 생산량이 계획 대비 10% 부족했습니다. 생산팀은 MES 데이터를 분석했습니다. 작업 시간, 투입 인원, 원료 사용량을 확인했습니다.
결론은 "작업자 투입이 부족했다"였습니다. 그래서 다음 달에는 작업자를 늘렸습니다. 하지만 생산량은 여전히 부족했습니다.
진짜 원인은 달랐습니다. 특정 설비의 잦은 소규모 정지가 누적되어 가동률이 떨어진 것이었습니다. 한 번에 10분씩, 하루에 5~6번 멈췄습니다. 작업자는 "설비가 자주 멈춘다"고 느꼈지만, MES에는 정확히 기록되지 않았습니다.
설비 센서 데이터에는 모든 정지 기록이 남아 있었습니다. 하지만 생산팀은 센서 데이터를 보지 않았습니다. 설비팀만 봤습니다.
만약 설비 센서 데이터와 생산 실적 데이터가 연결되어 있었다면? 즉시 발견할 수 있었습니다.
사례 3: POC는 성공, 확대는 실패
중견 기계 제조사에서 이상 탐지 모델을 만들었습니다. AI가 설비 이상 징후를 미리 감지하는 시스템이었습니다.
파일럿 라인에서는 90% 정확도로 작동했습니다. 성공적이었습니다. 다른 라인으로 확대하기로 했습니다.
하지만 적용이 안 됐습니다. 각 라인의 센서 데이터가 다른 프로토콜로 수집되고, 저장 형식도 제각각이었습니다. 파일럿 라인은 OPC UA 프로토콜이었는데, 다른 라인은 Modbus였습니다.
데이터 형식을 맞추는 작업만 몇 개월이 걸렸습니다. 결국 전사 확산은 포기했습니다. 파일럿에 머물렀습니다.
공통점: 데이터 연결 실패
세 사례 모두 데이터는 있었습니다. 품질 데이터도, 구매 데이터도, 설비 센서 데이터도, 생산 데이터도 모두 쌓여 있었습니다.
하지만 연결되지 않았습니다. 품질팀은 품질 데이터만, 생산팀은 생산 데이터만, 설비팀은 설비 데이터만 봤습니다. 시스템이 따로 놀았습니다.
제조 데이터 분석의 실패는 데이터 부족이 아니라 데이터 연결 실패입니다.
전통적 분석 vs AI 분석
전통적 분석: "무슨 일이 있었나"
전통적 제조 데이터 분석은 과거를 설명하는 데 강합니다. "이번 달 불량률이 왜 올랐나"라는 질문에 답합니다.
통계, 대시보드, 규칙 기반 분석을 사용합니다. 정형 데이터 중심이고, 사람이 가설을 세우고 검증합니다.
월간 리포팅, 실적 비교, 공정 성과 관리에 적합합니다. 담당자가 "작년 같은 달과 비교하면 불량률이 2% 높네. 원인을 찾아보자"라고 접근합니다.
하지만 데이터가 많아지고 변수가 복잡해지면 한계가 생깁니다. 사람이 모든 변수를 고려해서 규칙을 정의하기 어렵습니다.
AI 분석: "무슨 일이 일어날까"
AI 데이터 분석은 미래를 예측하는 데 강합니다. "다음 주 불량률이 올라갈까", "어느 설비가 곧 고장날까"라는 질문에 답합니다.
머신러닝, 이상 탐지, 예측 모델을 사용합니다. 정형 데이터뿐 아니라 비정형 데이터(이미지, 텍스트, 센서 로그)까지 활용합니다.
사람이 놓치는 복잡한 상관관계를 찾아냅니다. 온도, 압력, 진동, 원료 배합, 작업 시간 등 수십 개 변수 간의 패턴을 학습해서 불량을 예측합니다.
하지만 데이터 품질이 낮거나 편향되면 결과도 흔들립니다. 정상 데이터는 많은데 불량 데이터가 희소하면 학습이 제대로 안 됩니다.
제조업에서는 둘 다 필요
제조업에서는 전통적 분석으로 공정 성과를 관리하고, AI 분석으로 예지보전과 불량 예측을 합니다.
"지난달 왜 불량이 많았나"는 전통적 분석으로 답하고, "내일 이 설비가 멈출까"는 AI 분석으로 답합니다.
중요한 것은 둘 중 하나를 선택하는 것이 아니라, 두 분석 모두 데이터 연결이 전제되어야 한다는 점입니다.
품질 데이터만으로는 전통적 분석도, AI 분석도 제대로 작동하지 않습니다. 설비, 생산, 구매, 품질 데이터가 연결되어야 둘 다 의미 있는 결과를 냅니다.
구분 | 전통적 분석 | AI 분석 |
|---|---|---|
질문 | "왜 올랐나?" | "올라갈까?" |
목적 | 과거 설명 | 미래 예측 |
방식 | 통계, 대시보드, 규칙 | ML, 이상탐지, 예측 모델 |
데이터 | 정형 중심 | 정형 + 비정형 |
적합 | 실적 관리, 원인 분석 | 예지보전, 불량 예측 |
한계 | 변수 많으면 규칙 정의 어려움 | 데이터 품질 낮으면 결과 흔들림 |
전제조건 | 데이터 연결 | 데이터 연결 |
다비스(DARVIS) - 데이터 연결 + 원인 분석
시스템 통합 없이 데이터 연결
다비스(DARVIS)는 ERP, MES, QMS를 통합하지 않습니다. 기존 시스템을 그대로 두고, 데이터를 논리적으로만 연결합니다.
시스템 통합 프로젝트는 몇 년 걸리고, 수억 원이 듭니다. 데이터를 옮기고, 새 시스템을 구축하고, 사용자 교육을 해야 합니다. 리스크가 큽니다.
다비스(DARVIS)는 시스템을 건드리지 않습니다. 20년 된 ERP, 15년 된 MES, 서로 다른 프로토콜의 센서 데이터. 모두 그대로 둡니다. 데이터만 논리적으로 연결합니다.
소재 제조사 사례입니다. 구매 데이터(ERP), 생산 데이터(MES), 품질 데이터(QMS), 설비 센서 데이터를 4주 만에 연결했습니다.
시스템 교체 제로, 데이터 마이그레이션 제로, 조직 혼란 제로입니다. 기존 시스템은 그대로 쓰면서, 데이터만 연결해서 분석할 수 있게 됐습니다.
"왜"와 "조치"까지 자동 분석
일반 데이터 분석 도구는 "무슨 일이 있었는지"만 보여줍니다. 대시보드에 "A 제품 불량률 5% 상승"이라고 뜹니다. 그게 끝입니다.
다비스(DARVIS)는 "왜 그랬는지", "어떻게 해야 하는지"까지 자동으로 분석합니다.
"이번 달 불량률이 왜 올랐어?"라고 자연어로 물으면, AI가 품질 데이터, 설비 정비 기록, 원자재 배치, 작업자 교대, 공정 조건을 자동으로 연결해서 분석합니다.
"A 라인 불량률 상승은 3월 2주차 특정 부품 공급업체 변경 이후 발생. 동일 부품 사용 시점과 불량 발생 시점이 일치. 유사 사례 2건에서는 부품 재검증으로 해결."
담당자가 3~5일 걸려 찾던 원인을 2시간 내에 자동으로 제공합니다.
베테랑 노하우로 데이터 품질 보완
데이터 품질이 완벽하지 않아도 괜찮습니다. 베테랑의 판단 기준을 활용합니다.
"온도가 기준보다 5도 높으면 사절 위험 높음", "B 라인 가동률 30% 이하면 재고 과잉 가능성", "특정 원료 배치는 불량률 높은 경향" 같은 현장 노하우를 구조화해서 AI에게 가르칩니다.
데이터가 희소해도, 베테랑의 경험이 보완합니다. 불량 데이터가 몇십 건밖에 없어도, 베테랑이 수십 년간 쌓은 판단 기준을 시스템이 활용합니다.
식품 제조사 사례입니다. 30년 경력 재고 담당자가 "유통기한 짧은 원료는 입고 후 7일 이내 사용률 80% 이하면 폐기 위험"이라는 노하우를 갖고 있었습니다.
이 판단 기준을 구조화해서 다비스(DARVIS)에 입력했습니다. 이제 신입도 베테랑 수준의 분석을 받을 수 있습니다.
4주 만에 시작
전사 데이터 통합 프로젝트처럼 6개월~1년 걸리지 않습니다. 4주 만에 하나의 문제를 해결합니다.
부진재고 원인 분석, 불량률 상승 원인 추적, 납기 지연 원인 파악 중 하나를 선택합니다. 지금 가장 아픈 문제, 해결하면 즉시 효과가 보이는 것을 고릅니다.
앞 2주는 현장 컨설팅입니다. 필요한 데이터가 어디 있는지, 베테랑이 어떻게 판단하는지를 함께 정리합니다. 데이터 연결 구조를 설계하고, 판단 기준을 추출합니다.
뒤 2주는 프로토타입 구현입니다. 실제 데이터로 작동하는 원인 분석 시스템을 만듭니다. 담당자가 직접 질문해보고, 결과를 확인하고, 수정이 필요한 부분을 조율합니다.
중견 식품 제조사는 재고 원인 분석 시간을 3일에서 2시간으로 단축했습니다. 4주 만에 성과가 나왔습니다.
한 달에 6~8건의 원인 분석 업무가 있었는데, 한 건당 3일씩 절감되니 월 18~24일이 절감됩니다. 담당자는 분석 업무에서 해방돼 실제 개선 활동에 집중할 수 있게 됐습니다.
수집이 아니라 연결이 핵심
제조 데이터 분석이 어려운 이유는 데이터가 없어서가 아닙니다. 데이터가 연결되지 않아서입니다.
ERP, MES, QMS, 센서 데이터가 따로 놀면, 아무리 많은 데이터를 모아도 의사결정에 쓸 수 없습니다. 품질팀은 품질 데이터만, 생산팀은 생산 데이터만, 설비팀은 설비 데이터만 봅니다.
불량률 원인을 찾으려면 품질 데이터, 설비 데이터, 구매 데이터, 생산 데이터를 함께 봐야 합니다. 하지만 이 데이터들이 연결되어 있지 않으면, 담당자가 3~5일 동안 수작업으로 연결해야 합니다.
"우리 회사는 불량률 원인을 찾는 데 얼마나 걸리나요?"
만약 3일 이상 걸린다면, 데이터 사일로 문제입니다. 만약 시스템 통합 비용이 부담스럽다면, 기존 시스템 그대로 두고 데이터만 연결하면 됩니다. 만약 데이터 품질이 완벽하지 않다면, 베테랑 노하우로 보완하면 됩니다.
제조 데이터 분석, 데이터 수집이 아니라 연결이 먼저입니다. 다비스(DARVIS)로 시작하세요.
제조 데이터 분석 성공 사례와 데이터 연결 전략이 궁금하시다면 디피니트 다비스(DARVIS) 블로그를 구독해 보세요. 더 많은 제조 AI 인사이트는 'AI 인사이트 더 보러가기'에서 확인하세요.