Start Trial

6 February 2020

AI Fabric으로 일반적인 데이터 사이언스의 문제를 해결하세요

6 February 2020

AI Fabric으로 일반적인 데이터 사이언스의 문제를 해결하세요

데이터 다루는 것을 좋아하시나요? 데이터를 다뤄본 분이라면, 데이터를 다루는 것이 상당히 흥미로운 일인 반면 좌절에 빠지기도 쉽다는 것도 잘 알고 계실 겁니다.

 

데이터 사이언티스트는 데이터를 운용하면서 자신이 가진 열망과, 현실에 부딪히는 한계 사이에서 균형을 맞추기가 어렵습니다.

 

예를 들어, 회사에 머신러닝 모델을 제작할 수 있는 리소스가 없다면 마음에 드는 직책을 포기해야 할 수도 있죠. 데이터를 사용해 문제를 해결하려고 열심히 노력해도 끝내 만족할만한 결실을 얻지 못할 수도 있습니다. 이렇게 조직 및 운영상의 문제 때문에 업무가 난관에 봉착하면 담당자는 낙담해 데이터 작업을 좋아했던 이유를 잊어버리기 마련이죠.

 

그래서 이 글에서는 데이터 사이언티스트의 여정에 관해 얘기해보려 합니다.

 

• 데이터 세계에서 데이터 사이언티스트가 관심 있어 하는 것

 기대가 현실을 마주할 때 직면하게 되는 한계

데이터 과학을 RPA(Robotic Process Automation)와 같은 기술에 더 잘 통합하여 데이터 운영 방식을 변경해야 할 가능성

• AI(인공지능)와 RPA를 통합해 데이터를 최대한 활용할 새로운 기회를 창출하는 AI Fabric(AI 패브릭)에 대해 열정적인 이유

 

 

데이터 사이언티스트는 데이터에 대한 애정을 가지고 창의적으로 문제를 해결하는 해결사 역할을 수행하고, 데이터는 창의적으로 문제를 해결할 수 있도록 힘을 실어줍니다.

 

데이터 사이언티스트는 데이터를 사용하여 어려운 과제를 해결하고 사람들의 삶에 영향을 미치는 문제를 해결하죠. 많은 데이터 사이언티스트들이 현장에서 데이터를 통해 문제를 해결하는 방법을 배웁니다. 데이터 사이언티스트들은 확보한 데이터를 이해하고, 머신러닝 알고리즘을 탐색, 개발 및 사용해 데이터를 테스트한 다음, 자신들이 구축한 모델로 얻은 힘과 인사이트를 통해 새로운 솔루션을 실현할 방법을 모색합니다.

 

데이터 사이언티스트에게는 과제나 문제가 항상 존재하는데요. 다루는 데이터의 유형과 상관없이 다음과 같은 일을 수행하게 됩니다.

 

• 데이터 프로세싱 및 클렌징

모델 훈련을 위한 대기

각기 다른 하이퍼파라미터(hyperparameters) 테스트

 

데이터 사이언티스트는 데이터를 많이 다룰수록 조직 내에서 데이터 사이언스가 얼마나 복잡해질 수 있는 지에 대해서 알게 되는데요. 이렇게 현실을 마주하게 되면 실무에 이바지하고자 하는 동기가 무색해지기도 합니다

 

 

현실에 부딪힐 때: 기대치 설정 및 데이터 엔드 투 엔드 관리

 

많은 기업들이 데이터 기반 개발을 수용하고 있고, 동시에 머신러닝을 배워가는 초기 단계에 있습니다. 회사 내에서 데이터 사이언티스트의 역할은 여전히 한계가 많고, 오해를 받을 만한 경우가 많죠. 데이터 사이언티스트는 데이터 운영을 통해 문제 해결에 착수하면서 여러 가지 문제에 직면하게 되는데요.

 

우선 데이터 사이언티스트는 조직이 머신러닝으로 할 수 있는 것과 할 수 없는 것에 대한 기대치를 설정하는 것에 많은 시간을 보냅니다. 그리고 다른 사람에게 데이터 사이언티스트의 역할 특성, 시간을 쏟고자 하는 분야, 프로젝트 성공에 무엇이 필요한 지를 잘 전달해야 합니다.

 

또 다른 문제는 데이터 사이언스 운용이 종종 조직 내에서 고립되기도 한다는 사실입니다. 이는 데이터 프로젝트가 조직에 제공하는 가치를 떨어뜨릴 수 있습니다.

 

머신러닝 모델만으로는 아무것도 할 수 없고, 그렇게 해서도 안 됩니다. 이런 작업에 성공하기 위해선 반드시 다른 팀과 협력해 머신러닝 모델을 더 큰 프로젝트의 일부로 만들어야 합니다.

 

게다가, 모델로 창출한 투자 수익률(ROI)을 증명하는 것은 매우 어렵습니다. 데이터 사이언티스트들은 조직 내에서 머신러닝의 역할을 주장하기 위해 힘겨운 싸움을 벌일 때도 있습니다. 구현하고자 하는 것과 영향을 미치기 위해 필요한 것을 설명하기 위해 수많은 반복 작업을 수행해야 합니다.

 

데이터를 처리하는 것 자체에서 몇 가지 고유한 문제가 발생합니다. 데이터를 이해하고 모델을 구축하기보다는 데이터 세트를 수집, 통합 및 정리하는 데 더 많은 시간을 소모하죠. 모델에 대한 지속적 통합/지속적 배포(Continuous Integration and Continuous Delivery) 파이프라인이 회사 내에 이미 구축되어 있지 않은 경우, 대부분의 시간을 확장 가능한 파이프라인을 만들어 모델을 로컬 컴퓨터에서부터 스테이징 및 생산에까지 적용하는 데 쏟게 됩니다. 이것은 데이터 사이언티스트의 업무 범위를 벗어남과 동시에 모델 구축 및 테스트에 필요한 시간을 줄이는 결과를 가져옵니다.

 

지속적인 모델 모니터링은 아직 준비하지 못한 과제일 수 있는데요. 혹시 계속해서 데이터 이동을 실험 중이신가요? 생산 중인 데이터는 트레이닝에 사용한 데이터와 여전히 동일한가요? 결과물은 관리되고 있나요? 새로운 모델을 통한 모델 플랫폼은 트레이닝 세트로 구성된 기본 모델처럼 잘 작동하나요? 머신러닝 모델은 언제 업데이트하나요?

 

데이터 사이언티스트가 좋아하는 데이터 업무로 돌아가기 위해서는 우선 데이터 사이언스를 광범위한 프로세스 및 계획과 통합하는 것을 우선시하는 회사에서 근무할 기회를 모색해야 합니다. 데이터 사이언티스트는 데이터 사이언스를 조직 내부에서 우선시 할뿐만 아니라 머신러닝 모델을 운영하고 소비하여 더 나은 비즈니스 성과를 이끌어 낼 수 있도록 적극적으로 노력하는 회사에서 일해야 합니다.

 

 

AI Fabric으로 데이터 사이언티스트가 좋아하는 본연의 업무로 돌아가기

 

점점 더 많은 조직이 RPA를 사용하여 프로세스를 간소화함에 따라 데이터 사이언티스트는 새로운 방식으로 데이터를 운영할 수 있는 기회가 생겼습니다.

 

UiPath는 데이터 사이언스와 RPA를 통합하고, 인텔리전트 자동화를 사용하여 비즈니스가 새로운 결과를 창출할 수 있도록 힘 쓰고 있습니다. UiPath는 데이터 사이언스와 RPA를 연결해 자동화 세계에서 데이터 사이언티스트들이 일상적으로 마주하는 많은 과제를 해결하고자 합니다. UiPathAI Fabric 으로 이러한 노력을 주도하고 있습니다.

 

관련 읽을 거리: 헤리티지 은행(Heritage Bank)이 AI 및 AI Fabric을 사용하는 방법

 

UiPath는 데이터 사이언스와 RPA가 통합될 때 시너지 효과를 낸다고 믿습니다. 데이터 사이언티스트가 데이터 및 머신러닝으로 RPA 기능을 향상시킬 수 있는 가능성을 간략하게 설명해 데이터 사이언스를 RPA CoE(Center of Excellence)의 필수 요소로 만드는 것이 관건입니다.

 

UiPath는 AI Fabric 개발을 통해 조직이 머신러닝을 자동화 프로세스의 한 단계로 생각하도록 지원하는 데 집중하고 있습니다. UiPath는 사용자가 머신러닝과 RPA 개발을 보다 매끄럽게 통합하도록 지원하고 있는데요. 데이터 사이언티스트는 AI Fabric RPA를 사용해 전처리 및 데이터 수집에 중점을 둔 도구로 데이터 파이프라인 구축을 단순화 할 수 있습니다. 데이터 사이언티스트들은 모델을 쉽게 배포하고 모니터링하며, 사람과 머신러닝 모델이 협업하도록 설계된 RPA 워크플로우를 수용할 수 있죠.

 

UiPath는 데이터 사이언스를 RPA와 결합함으로써 데이터 사이언티스트가 구축 및 배포된 모델에 대한 투자수익률을 입증하고, 대부분의 시간을 현실 문제를 해결하는 데이터 탐색 및 모델 개선에 소비할 수 있도록 지원합니다.

 

 

데이터에 집중할 수 있는 더 많은 자유가 생긴다면 무엇을 하실건가요?

 

UiPath는 데이터 사이언티스트가 데이터로 문제를 해결하고, 데이터 사이언스를 기존 프로세스에 통합함으로써 조직의 발전 및 성장 방식을 바꿀 수 있다고 믿습니다.

 

가장 중요한 것은 고객이 더 나은 성과를 내도록 돕는 것입니다. UiPath는 데이터 사이언스와 RPA를 결합해 기업이 더 복잡한 프로세스를 자동화하는 것을 직접 확인하고 있습니다. 기업이 AI Fabric과 같은 제품을 통해 RPA 배포에 데이터 사이언스를 도입하면서 데이터 사이언티스트가 일반적인 데이터 운영 문제로부터 벗어날 수 있다는 것은 상당히 의미 있는 일입니다.

 

UiPath는 사용하기 쉬운 스튜디오X(StudioX) 및 데이터 RPA 프로세스와 AI를 결합한 AI Fabric에 대한 자세한 내용을 웨비나로 소개할 예정입니다. 지금 바로 등록하고 자동화 솔루션의 기능을 데모와 함께 확인해 보세요!

 

김형수_프로필_Blue2

 

 


by UiPath Korea

TOPICS: AI, 로보틱프로세스자동화, 자동화, 로봇프로세스자동화, 사무자동화, 유아이패스, RPA + AI, 인공지능, 머신러닝, AI Fabric, AI 패브릭

Show sidebar