본문 바로가기
IT 컴퓨터상식

인공지능 머신러닝 업무 프로세스

by 변화마스터 2022. 4. 28.
반응형

이제 인공지능이라는 사업을 프로젝트에 끌어들여서 신사업 발굴이나 일하는 방법의 개선을 가져올 수 있을까를 작년부터 고민하기 시작했는데 실제로 업무에 프로젝트를 적용할때 어떻게 해야하는지 정리해보기 위해 작성했습니다.

아마 1년 후에 이 글을 다시 읽으면 많이 부족할 수도 있을것 같네요.

머신러닝을 어디에 적용할지가 정해졌다면 모델을 만들어야합니다.

그런 관점에서 어떻게 실무적으로 프로세스가 진행되는지를 저도 이해하면서 적도로록 할게요.

먼저 어디에 적용할지를 정했다면 해당 분야의 배경 및 원하는 결과, 그리고 이를 위해 필요한 머신러닝 모델에 대해 파악을 합니다.

이 부분 때문에 일반 직장인도 머신러닝을 알아야하는 것 같습니다.

머신러닝이 어떤 분야에 어떻게 도움이 될지는 그 분야에서 계속 일했던 사람이 도움을 주어야하며 머신러닝이 무엇인지를 알아야 어떻게 도움을 줄지를 예측할 수 있기 때문입니다.

이렇게 어떻게 도움이 될지를 생각해서 머신러닝 모델에 대한 구상이 끝났다면 데이타를 모아야겠죠.

그리고 데이타를 분석하여 어떤 데이터가 머신러닝 모델에 연관이 될지를 분석합니다.

일단 처음에는 어떤 변수가 결과에 영향을 미치는지 모르기 때문에 함부로 버리기가 힘들것 같습니다.

만약 저한테 필요한 머신러닝 모델이 무엇이냐고 물어본다면 다음달 매출이나 내년 매출 예측이 될 것 같습니다.

아마 많은 회사에서도 알고 싶고 예측하려고 시도하는 부분이 아닐까 싶습니다.

과거 3개년 데이터로 다음달 매출을 예측하는 모델을 만들려고 한다고 가정하면 일단 회사에서 다음달 매출을 예측한다는 것은 매우 도움이 될 것이며 매출이라는 y값을 여러가지 변수(각 부분의 판매량 및 외부요인 등)를 통해 추론하는 것이니 머신러닝의 모델로 나쁘지 않을 것 같습니다.

그리고 데이터를 수집합니다.

회사에 따라서 매출 주기가 가장 영향을 미칠수도 있을 것이며 국내 경제환경에 영향을 받을 수도 있고 이렇다면 경제성장율 전망치가 주요하게 작용할 수도 있겠네요.

해외수출 중심의 회사라면 imf등에서 발표한 세계경제성장률 지수 등도 활용될 수 있을 것 같습니다.

이렇게 수집된 데이터를 이제 머신러닝에 사용할 수 있는 데이터로 가공을 해야겠죠.

이때는 없는 값도 많을테고 말로 된 데이터나 그림으로 된 데이터도 많을테고 하여튼 머신러닝에 적합하지 않은 데이터도 많을 것 입니다.

이러한 데이터를 어떻게할지 결정하고 없는값은 어떻게 할지 이러한 내용 등을 정리해서 데이터에 적용하여 전처리 작업을 하게 됩니다.

이제 머신러닝 모델을 설계하고 훈련데이터와 검증데이터로 구별된 데이터를 모델에 학습시킵니다.

훈련데이터로 모델을 학습시키고 검증데이터로 모델을 평가하는 이러한 과정을 지속적으로 거쳐서 모델 성능을 높입니다.

이렇게 발전된 모델을 실제 업무에 사용한 후 피드백하여 모델을 수정하고 지속적인 학습을 시킵니다.

그래서 점점 더 예측성이 좋은 다음달 매출예측 모델을 개발하게 되는 것겠죠.

아주 간략히 설명했고 이 설명은 인공지능 전문가영역은 빼고 설명했기 때문에 이 프로세스에 나와있는 내용을 안다고 인공지능에 대해 알고 있다고 하는 것은 무리겠죠.

실제로 인공지능이라는 타이틀로 사람을 뽑을 때는 위의 내용에서 빠진 부분을 수행하고 그런 능력을 가진 사람을 말할테니까요.

 

반응형