딥 러닝 기술

빅데이터

딥 러닝 기술

성공을 도와주기 2018. 12. 2. 13:53

머신러닝의 사용자

많은 양의 데이터를 처리하고 분석하는 대부분의 산업에서는 머신러닝을 적극적으로 활용하고 있습니다. 대부분 실시간 데이터를 분석하고 인사이트를 얻음으로써 기업은 보다 효과적으로 기회를 포착하고 경쟁 우위를 획득할 수 있습니다.

금융 서비스

은행을 비롯해 금융 산업에서는 머신러닝 기법을 다음과 같이 활용합니다. 첫째로 데이터로부터 중요한 인사이트를 확인하고 사기를 방지하는 것입니다. 이러한 인사이트는 투자 기회를 확인하거나 투자자가 거래 시기를 정확히 파악할 수 있도록 지원합니다. 또한 데이터 마이닝을 이용해 고위험 특징을 보이는 클라이언트를 식별하거나 사이버 감시를 이용해 사기의 전조 징후를 정확하게 발견해낼 수 있습니다.

정부

공공의 안전을 담당하는 정부 부처와 공공 서비스를 제공하는 기관에서는 다양한 데이터를 가지고 있기 때문에 머신러닝으로 인사이트를 획득할 수 있는 기회가 특히 많습니다. 예를 들어, 센서 데이터를 분석하여 효율성을 높이고 비용을 절감할 수 있는 방법을 찾아낼 수도 있고 머신러닝을 이용하여 사기를 감지하고 개인정보 도용을 최소화할 수도 있습니다.

의료 서비스

IoT 기술을 이용해 환자의 건강 상태를 실시간으로 파악할 수 있는 웨어러블 장치와 센서 덕분에 의료 산업은 머신러닝이 빠르게 성장하는 주 무대가 되고 있습니다. 또한 머신러닝은 의료 전문가가 실시간 데이터를 분석하여 환자의 변화 추이나 적색 경고를 확인함으로써 진단과 치료 효과 개선에 활용될 수 있습니다.

마케팅 및 영업

구매자가 좋아할 만한 상품을 추천하는 웹사이트도 머신러닝을 활용할 수 있습니다. 과거 구매자의 검색 및 구매 기록을 분석하여 상품 추천 및 홍보에 사용할 수 있습니다. 이렇게 데이터를 포착하여 활용해서 쇼핑 경험을 개별화(또는 마케팅 캠패인 실행)하는 추세가 산업의 미래로 다가오고 있습니다.

석유 및 가스

새로운 에너지원의 발견, 매장된 광물 분석, 정유 시설의 센서 고장 예측, 보다 효율적이고 경제적으로 석유 물류 구조 개선 등 석유 및 가스 산업에서 머신러닝을 활용할 수 있는 부분이 매우 많을 뿐 아니라 계속해서 그 사용 범위가 늘어나고 있습니다.

운송

수익성을 높이기 위해 이동 경로를 효율적으로 배치하고 잠재적인 문제를 예측해야 하는 운송 업계에서도 데이터를 분석하여 패턴과 트렌드를 찾아내는 기술이 핵심 기술로 대두되고 있습니다. 따라서 택배 업체, 대중 교통 서비스 및 기타 운송 기업은 머신러닝의 데이터 분석과 모델링 기술을 중요한 분석 솔루션으로 이용하고 있습니다.

딥 러닝 30가지 사례

https://brunch.co.kr/@itschloe1/23

널리 사용되고 있는 머신러닝 기법

가장 널리 채택되고 있는 머신러닝 기법은 지도 학습과 비지도 학습 두 가지이지만 그 밖의 머신러닝 방법들도 존재합니다.
여기에서는 가장 일반적으로 활용되는 유형에 대해 간략히 알아봅니다.

지도 학습 알고리즘은 목표 출력값을 알고 있는 입력값처럼 레이블이 지정된 데이터 정보를 사용해 트레이닝됩니다. 예를 들어 데이터 포인트에 "F"(failed) 또는 "R"(runs)이라는 레이블이 지정되어 있는 장비가 있다고 가정해 봅시다. 그러면 학습 알고리즘에 따라 입력값 집합이 그에 상응하는 정확한 출력값과 함께 수신됩니다. 이후 실제 출력값과 정확한 출력값을 서로 비교하여 오류를 검출하면서 알고리즘 학습이 이루어집니다. 그런 다음 학습 결과에 따라 모델을 수정합니다. 지도 학습은 분류, 회귀분석, 예측 및 변화도 부스팅 등의 기법을 통해 발견한 패턴을 사용하여 추가로 레이블이 지정되지 않은 데이터의 레이블 값을 예측합니다. 지난 데이터를 기반으로 앞으로 있을 이벤트를 예측하는 데 지도 학습이 가장 보편적으로 사용됩니다. 예를 들어 신용 카드 거래의 사기성이나 보험 가입자의 보험금 청구 가능성 여부 등을 예측하는 데 효과적입니다

비지도 학습은 이전 레이블이 없는 데이터를 학습하는 데 사용됩니다. 이 시스템에는 "정답"이 없기 때문에 알고리즘을 통해 현재 무엇이 출력되고 있는지 알 수 있어야 합니다. 따라서 데이터를 탐색하여 내부 구조를 파악하는 것이 목적입니다. 비지도 학습은 트랜잭션 데이터에서 특히 효과적입니다. 예를 들어 유사한 속성의 고객 세그먼트를 식별한 후 그 유사성을 근거로 마케팅 캠페인에서 고객 세그먼트를 관리하거나 고객 세그먼트의 구분 기준이 되는 주요 속성을 찾을 수도 있습니다. 주요 기법으로는 자기 조직화 지도(self-organizing maps), 최근접 이웃 매핑(nearest-neighbor mapping), k-평균 군집화(k-mㅇeans clustering), 특이값 분해(singular value decomposition) 등이 있는데, 이러한 알고리즘은 텍스트 주제를 세분화하고 항목을 권장하며 데이터 이상점(Outlier)을 식별하는 데도 이용됩니다.

준지도 학습이 활용되는 응용 분야는 지도 학습과 다르지 않습니다. 하지만 레이블이 지정된 데이터와 레이블이 지정되지 않은 데이터를 모두 사용해 트레이닝한다는 점에서 차이가 있습니다. 주로 레이블이 지정된 데이터는 용량이 작고, 레이블이 지정되지 않은 데이터는 용량이 큽니다. 그 이유는 레이블이 지정되지 않은 데이터의 경우 수집에 많은 노력이 필요하지 않아 비용이 저렴하기 때문입니다. 또한 준지도 학습은 레이블 지정에 따른 비용이 너무 높아서 완전한 레이블 지정 트레이닝이 어려운 경우에도 유용합니다 이 학습 기법을 사용한 초기 사례로는 웹 캠을 이용한 안면 인식 기술이 있습니다.

강화 학습은 로봇, 게임 및 내비게이션에 많이 이용됩니다. 강화 학습 알고리즘은 시행착오를 거쳐 보상을 극대화할 수 있는 행동을 찾아냅니다. 이러한 유형의 학습은 기본적으로 에이전트(학습자 또는 의사결정권자), 환경(에이전트가 상호작용하는 모든 대상), 동작(에이전트 활동)이라는 세 가지 요소로 구성됩니다. 이 알고리즘의 목적은 에이전트가 일정한 시간 내에 예상되는 보상을 극대화할 수 있는 동작을 선택하도록 하는 데 있습니다. 에이전트는 유효한 정책을 따라 목표에 이르는 시간이 더욱 빨라집니다. 따라서 강화 학습의 목표는 최선의 정책을 학습하는 것이라고 할 수 있습니다.

일반적으로 사람이 1주일에 생성할 수 있는 양질의 모델은 1~2개에 불과하지만 머신러닝은 같은 기간에 수천 개의 모델을 생성할 수 있습니다.

Thomas H. Davenport, 분석 기술의 권위자
The Wall Street Journal 발췌

데이터 마이닝, 머신러닝, 딥러닝의 차이

이 세 가지 방법은 모두 인사이트, 패턴 및 관계를 도출하여 의사 결정에 이용한다는 동일한 목적을 가지고 있지만 접근 방식과 해낼 수 있는 역할에 차이가 있습니다.

데이터 마이닝 (Data Mining)

데이터 마이닝은 데이터로부터 인사이트를 도출해내기 위한 많은 방법들의 상위 개념으로 볼 수 있습니다. 여기에는 전통적인 의미의 통계 기법과 머신러닝도 포함됩니다. 데이터 마이닝은 다양한 영역의 기법을 적용하여 이전에 데이터에서 발견하지 못한 패턴을 찾아낼 수 있는데, 여기에는 통계적 알고리즘, 머신러닝, 텍스트 분석, 시계열 분석 등 기타 다양한 영역의 분석 기법이 포함됩니다. 그 밖에 데이터 스토리지 및 조작에 대한 연구와 노력도 예외는 아닙니다.

머신러닝 (Machine Learning)

머신러닝의 주요 차이점은 일반적으로 통계 모델이 그러하듯 데이터 구조를 파악할 목적으로 데이터에 이론적 분포를 적용한다는 점입니다. 그러다 보니 통계 모델에서는 수학적 검증을 통해 모델을 뒷받침하는 이론이 있기 마련입니다. 하지만 이러한 이론 역시 데이터가 납득할 수 있는 가설을 만족해야만 성립됩니다. 비록 데이터 구조의 형태를 나타내는 이론은 없다고 해도 머신러닝은 데이터의 구조 유무를 탐색할 수 있는 컴퓨터의 능력을 기반으로 개발되었습니다. 머신러닝 모델에 대한 테스트는 귀무 가설을 검증하기 위한 이론적 테스트가 아니라 새로운 데이터에 대한 검증 오차를 통해 이루어집니다. 머신러닝은 반복적인 접근 방식으로 데이터를 통해 학습하기 때문에 손쉽게 자동화할 수 있습니다. 이후 데이터를 통해 패스를 반복하며 강력한 패턴을 발견하게 됩니다.

딥러닝 (Deep learning)

딥러닝은 놀랍도록 향상된 컴퓨팅 파워와 특수한 유형의 신경망을 서로 결합하여 대용량의 데이터에서 복잡한 패턴을 학습합니다. 오늘날 딥러닝은 기법은 이미지에서 개체를, 사운드에서 단어를 식별하는 최첨단 기술로 인정받고 있습니다. 그 밖에 연구 기관들도 자동 언어 번역, 의학적 진단, 그 밖에 중요한 사회 및 비즈니스 문제 등 복잡한 과제에 이러한 성공적인 패턴 인식 기술을 적용하려는 모습도 보이고 있습니다.

활용 방안

머신러닝의 가치를 극대화 하기 위해서는 최적의 알고리즘과 적합한 도구 및 프로세스를 결합시키는 방법을 알아야 합니다. SAS는 통계 및 데이터 마이닝 분야에서 쌓아온 풍부하고 정교한 노하우와 새로운 아키텍처 기술을 결합하여 방대한 엔터프라이즈 환경에서도 분석 모델의 운영 시간을 최대한 단축할 수 있습니다.

알고리즘: SAS 그래픽 인터페이스는 머신러닝 모델을 구축하여 반복적인 머신러닝 프로세스를 구현하는 데 효과적입니다. 통계 전문가 뿐 아니라 실무진 등 모든 사용자들이 쉽게 사용할 수 있습니다. 다양한 SAS 솔루션에 머신러닝 알고리즘이 포괄적으로 구성되어 있으므로 원하는 알고리즘을 선택하여 빅 데이터의 가치를 신속하게 창출할 수 있습니다. SAS는 아래와 같은 머신러닝 알고리즘을 제공합니다

'빅데이터' 카테고리의 다른 글

시니어 직원들도 디지털 인재로 변신할 수 있을까? (0)	2018.12.30
디지털 트윈 어떻게 전개될 것인가? (0)	2018.12.30
제4차 산업혁명의 핵심 화두, 인공지능 (0)	2018.12.02
인공지능의 주인이 되기 위해 반드시 알아야 할 것들 (0)	2018.10.18
딥러닝 1. AI and Neural Network (한국어) (0)	2018.06.09

현재글딥 러닝 기술

안소니 블로그

장, 정경숙과 장외주식으로 만드는 행복 세상,

Today :
Yesterday :

일	월	화	수	목	금	토
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

안소니 블로그