빅데이터

[모이면 힘이 된다, 빅데이터②] 빅데이터의 보고, 공공데이터 포털

성공을 도와주기 2014. 8. 14. 12:11
빅데이터가 뜨고 있다. 카드 사용 내역으로 구매 패턴을 찾아내던 상업적 차원의 활용을 넘어 최근에는 시민을 위한, 시민의 빅데이터가 활용되고 있다. 교통, 의료, 재난, 범죄 등 분야도 다양하다. 정부와 자치단체의 빅데이터 활용 사례를 살펴보고 빅데이터와 관련한 쟁점을 짚어본다. [편집자말]

 

 

데이터는 이 순간에도 무수히 만들어지고 있다. 포털에서 키워드를 검색하는 순간부터, 트위터에 특정 단어를 속삭이는 순간, 각종 '흔적'이 데이터로 쌓이고 있다. 그동안 이런 데이터들은 쉽게 방치돼 왔다. 먼지에 불과하다는 인식 때문이다.

이제는 달라졌다. 먼지 같았던 데이터들이 저장 기술과 분석 소프트웨어의 발달로 재활용이 가능해졌다. 과거에는 지나쳤던 흐름을 잡아 이제는 빅데이터로 가공됐다. 때문에 빅데이터를 사고파는 일은 중요한 부가가치 산업이 되고 있다.

특히 세금이 들어간 공공기관의 데이터는 이미 널려 있다. 관계 법령이 제정되면서 시민이 요구하면 특별한 이유가 없는 한 데이터를 개방해야 한다. 신뢰성과 정확성이 높은 공공기관 데이터의 활용도가 높아지고 있다.

데이터포털, 올해 상반기만 12억 데이터 활용

기사 관련 사진
 2011년 7월부터 운영된 공공데이터 포털은 안전행정부와 미래창조과학부가 운영하고 있으며 7일 현재 개방 기관만 702개에 달하며 주제별 데이터 집합을 의미하는 데이터셋은 9684개에 이른다. 올해 상반기 6개월동안 데이터를 활용한 숫자는 12억 190만 건에 달한다.
ⓒ 안전행정부

관련사진보기


공공 기관의 데이터는 공공데이터포털(아래 포털)에 집적되고 있다. 2011년 7월 시범 운영된 포털은 안전행정부와 미래창조과학부가 운영하고 있으며 7일 현재 개방 기관만 702개에 달하며 주제별 데이터 집합을 의미하는 데이터셋은 9684개에 이른다. 올해 상반기 6개월동안 데이터를 활용한 숫자는 12억 190만 건에 달한다. 미국은 앞서 공공 데이터공유 허브인 'data.gov', 영국은 'data.gov.uk'를 통해 공공정보를 민간에 개방해 왔다. 

포털을 살펴보면 지역 건물의 공시지가를 비롯해 전남 장수군의 목욕탕 업체 정보, 인천시 남동구의 공장등록 현황, 강원 속초시의 유치원 현황 등 공공기관이 생산한 정보를 열람할 수 있다. 이 데이터를 바탕으로 만든 애플리케이션(아래 앱)과 웹 사이트 등의 사례가 한눈에 볼 수 있도록 분야별로 제공된다.

민간 기업의 포털 활용도도 높아지고 있다. 기업에서 공공 데이터에서 의미있는 패턴을 읽어낸다면 이것은 새로운 수익의 원천이 된다. 매킨지 등 유수의 글로벌 컨설팅 기업이 빅데이터를 향후 경제지형을 바꿀 핵심 기술로 꼽는 이유다. 최근 앱 개발 등 IT 분야의 소규모 벤처 기업이 공공 데이터를 재가공한 빅데이터로 사업에 쏠쏠한 재미를 보고 있다.

세금 들어간 내 데이터, 내놔... 공공데이터법은?
지난해 10월, '공공데이터의 제공 및 이용 활성화에 관한 법률'(공공데이터법)이 시행됐다. 이 법에 따라 누구나 정부 부처와 지방자치단체 등 공공기관의 필요한 데이터에 대해 제공을 요청할 수 있다. 10일 이내에 제공 여부에 대해 답변 받을 수 있다.

법 시행 전에는 공공기관이 데이터 개방 여부를 결정해왔다. 이 법에 따라 비밀·국가안보·재판·사생활보호 등과 관련되지 않으면 원칙적으로 모두 개방해야 한다. 또 정부 기관이 데이터 제공을 중단 또는 거부하면 60일 이내에 공공데이터 분쟁조정위원회에 조정을 신청을 할 수 있다.

안행부에 따르면 공공데이터법 시행 이후 공공데이터의 주제별 데이터 집합을 의미하는 데이터셋 다운로드가 월평균 118건에서 1465건으로 12배 뛰었다. 또 공공기관이 제공하는 정보를 민간에서 앱 개발 등에 바로 활용할 수 있게 하는 표준인터페이스인 오픈 API신청건수도 월평균 574건에서 2066건으로 4배 늘었다.

'메디벤처스'라는 벤처 기업은 건강보험심사평가원의 5만 8천개에 달하는 병원 정보와 진료 기록, 시술 정보 등을 제공 받았다. 여기에 자신들이 직접 생산한 병원 정보를 재가공해 지난 2012년 10월, '메디라떼'라는 앱을 출시했다.

이 앱은 비급여 진료 대상인 성형외과, 치과, 안과, 피부과 등 진료과목과 지역에 따라 병원을 검색할 수 있다. 질환 종류별로 진료가 가능한 병원 검색도 가능하다. 앱에서 의료진 정보와 리뷰 등을 볼 수 있으며 카카오톡이나 전화로 상담할 수도 있다. 또 사용자에 따라 지역별, 혜택별, 거리순 등 실시간 맞춤형 정보를 제공받아 사용자가 원하는 최적의 병원을 추천한다.

이 앱이 성공하자 병원 광고가 늘어나 지난해에만 13억 원의 매출을 기록했고 올해는 지난해 2배가 넘는 30억 원의 매출을 예상하고 있다. 이희용 메디벤처스 공동대표는 "공공기관이 생산한 정보는 신뢰도가 높아 기업의 활용도가 매우 높다"며 "사용 정보를 모아서 빅데이터를 만들고 이를 통해 소비자에게 정확도 높은 맞춤형 정보를 제공하게 된다"고 말했다. 

서울도 데이터 포털 운영... 민간 데이터 개방 시도

기사 관련 사진
 서울시의 데이터포털 '열린데이터 광장'에는 시민들이 직접 제작한 앱과 사이트를 볼 수 있다 . 김지완씨는 서울시 농수산 식품공사의 일일 실거래가 정보를 바탕으로 '오늘의 농산물' 앱을 제작했다. 김세호씨는 대기 환경 데이터를 이용하여, 실시간 대기 정보 및 예,경보 현황을 보여주는 앱을 만들었다.
ⓒ 서울시

관련사진보기


자치단체 중에는 서울시의 '열린 데이터 광장'(아래 광장)이 가장 앞선다. 박원순 서울시장은 정보의 개방·공유·소통을 모토로 '열린 시정 2.0'을 핵심 업무로 추진하면서 지난 2012년 5월, 광장의 문을 열었다. 포털이 중앙 정부가 생산한 정보가 중심이라면 광장은 시민 생활과 밀접한 정보들이 제공돼 있다. 광장의 데이터는 공공데이터포털에서도 활용될 수 있도록 공유된다.

현재 광장에는 교통, 환경, 도시 관리, 주차 등 10개 분야에 2600여 종의 데이터 이용이 가능하다. 부동산 실거래가, 공영 주차장 이용 정보, 거리별 유동 인구 등 서울시민들의 실제 생활과 관련된 정보가 집약돼 있다. 버스, 지하철 등 대중교통 관련 정보에 대해 수요가 높은 편이다.

시민들은 이 데이터를 바탕으로 직접 앱과 사이트를 제작했다. 김지완씨는 서울시 농수산 식품공사의 일일 실거래가 정보를 바탕으로 '오늘의 농산물' 앱을 제작했다. 김세호씨는 대기 환경 데이터를 이용하여, 실시간 대기 정보 및 예·경보 현황을 보여주는 앱을 만들었다.

광장 데이터를 기반으로 정보를 제공하는 사이트도 운영되고 있다. '데이터 저널리즘'을 표방하는 '뉴스젤리'는 서울시와 MOU를 체결해 디지털 스토리텔링과 인포그래픽을 생산하고 있다. 예를 들면, 서울시의 구별 횡단보도 데이터를 받아 재가공했다. 횡단보도수가 가장 많은 구(강남구 2516개)와 가장 적은 구(금천구 765개)를 비교해 그래픽으로 제작했다. 임준헌 뉴스젤리 대표는 "개방된 데이터의 양이 부족하지만 공공의 정확하고 신뢰도 높은 데이터를 통해 가공한 새로운 정보를 생산한다"고 말했다.

앞으로 광장은 개방 기관을 확대하고 민간 데이터도 개방할 방안을 마련하고 있다. 이혜자 서울시 정보기획관 데이터개방팀장은 "올해말까지 서울시 25개 자치구들의 데이터들도 이곳에 모여들게 된다"며 "민간이 생산한 정보들도 시민에게 개방될 수 있도록 민간 부문과의 협력을 논의하고 있다"고 말했다.