데이터베이스 활용 사례 - deiteobeiseu hwal-yong salye

데이터베이스 활용사례

  • 상세정보
  • 자료후기 (2)
  • 자료문의 (0)
  • 판매자정보

소개글

데이터베이스가 무엇이고 어떤곳에 활용되며 문제점이 무엇이지에 대해
서술한 글입니다.참고하세요^^

목차

◎ 데이터 베이스가 갖는 의미
◎ 데이터 베이스의 활용사례
◎ 데이터베이스 관리의 문제점 - 개인정보유출

본문내용

◎ 데이터 베이스가 갖는 의미
데이터 베이스란 단어의 의미는 한마디로 압축하기가 매우 힘들다. 사전적으로는 ‘여러 사람에 의해 공유되어 사용될 목적으로 통합 관리되는 정보의 집합’이라 할 수 있다. 하지만 이 한줄의 설명만으로는 그 의미가 충분히 와 닿지를 않는다. 단순히 정보를 모아둔 것이 데이터 베이스인지, 아니면 그 정보를 모아서 조합하고, 응용하여 실제 사용가능한 것이어야 하는지를 판단하기란 쉬운 일이 아니다. 하지만 이런 의미의 규정이 어떤지, 정의가 무엇인지에 앞서 이미 우리 생활에는 데이터베이스 기술이 널리 퍼져있는 것이 현실이다. 세계적으로 기업들은 이전의 무차별적 광고와 마케팅에서 벗어나 데이터베이스를 기초로 하여 사업을 전개해 나가고 있다.

◎ 데이터 베이스의 활용사례
우리나라에서 데이터 베이스를 실제 사업에 이용한 사례로는 LG전자와 대우자동차를 꼽을 수 있다. LG전자는 96년 11월부터 ‘통합고객정보시스템’을 구축하기 시작했다. 이는 서비스센터와 대리점 영업부서 등에 흩어져 있던 서울지역 소비자 2백만 명의 데이터를 호스트 컴퓨터에 끌어 놓는 작업부터 시작했다. 약 20억원이 들은 이 사업은 업무별로 따로 관리되던 데이터의 통합으로 고객 서비스를 한 차원 높일 수 있었다. 예를 들어 진공청소기 필터를 구입하기 위해 대리점을 찾았다가 모델명을 몰라 발길을 돌리는 경우가 있었다. 하지만 이제 서울지역 LG전자 전 대리점에서도 고객의 제품보유 현황이 조회된다. 전화선으로 인터넷에 있는 고객통합정보시스템에 접속하여, `아, 언제 구입하신 어느 모델을 갖고 계시군요`라며 바로 맞는 필터를 내줄 수 있다.

LG전자는 이 통합고객정보시스템을 고객 서비스 향상이라는 시스템 초기 활용목적에서 한걸음 더 나아가 ‘타겟고객 판촉’을 벌였다. 자신들이 확보한 고객의 데이터베이스를 기초로 가전제품 판매신장에 효과를 도모한 것이다. 즉, 고객정보를 대리점 전산관리프로그램에 입력한 뒤 상품의 교체주기에 이른 고객에게만 집중적으로 광고물을 보내는 것을 주요 내용으로 하는 판촉방법이다. 예컨대 세탁기 신제품이 나오면 세탁기를 구입한지 7년 이상된 고객에게만 카탈로그를 보낸다.

태그

이 자료와 함께 구매한 자료

빅데이터란 데이터베이스 등 기존의 데이터 처리 응용 소프트웨어로는 수집 · 저장 · 분석 · 처리하기 어려울 정도로 방대한 양의 데이터를 의미한다. 빅데이터 기술의 발전은 다변화된 현대 사회를 정확하게 예측하여 효율적으로 작동케 한다.

빅데이터의 활용사례

     1. 정치

     2. 경영

     3. 사회

     4. 문화

     5. 과학기술

1. 정치

  • 2008년 미국 대통령 선거

2008년 미국 대통령 선거에서 버락 오바마 미국 대통령 후보는 다양한 형태의 유권자 데이터베이스를 확보하여 이를 분석, 활용한 '유권자 맞춤형 선거 전략'을 전개했다. 당시 오바마 캠프는 인종, 종교, 나이, 가구형태, 소비 수준과 같은 기본 인적 사항으로 유권자를 분류하는 것을 넘어서서 과거 투표 여부, 구독하는 잡지, 마시는 음료 등 유권자 성향까지 전화나 개별 방문을 또는 소셜 미디어를 통해 유권자 정보를 수집하였다. 수집된 데이터는 오바마 캠프 본부로 전송되어 유권자 데이터베이스를 온라인으로 통합 관리하는 '보트 빌더'시스템의 도움으로 유권자 성향 분석, 미결정 유권자 선별, 유권자에 대한 예측을 해나갔다. 이를 바탕으로 '유권자 지도'를 작성한 뒤 '유권자 맞춤형 선거 전략'을 전개하는 등 오바마 캠프는 비용 대비 효과적인 선거를 치를 수 있었다.

2. 경영

  • 아마존닷컴의 추천 상품 표시

아마존닷컴은 모든 고객들의 구매 내역을 데이터베이스에 기록하고, 이 기록을 분석해 소비자의 소비 취향과 관심사를 파악한다. 이런 빅데이터의 활용을 통해 아마존은 고객별로 '추천 상품'을 표시한다. 고객 한 사람 한사람의 취미나 독서 경향을 찾아 그와 일치한다고 생각되는 상품을 메일, 홈페이지상에서 중점적으로 고객 한사람 한 사람에게 자동적으로 제시하는 것이다. 

3. 사회

  • 코로나19와 이민자, 유학생 간 상관관계

코로나19 확진자의 국가별 통계와 중국인 유학생 이동 통계, 중국인 이민자 수 통계를 이용한 상관성 분석을 통해 코로나19의 세계적 확산 양상이 중국 이민자 및 유학생 진출자 수와 비교적 강한 상관관계를 지닌다는 국내연구팀의 분석 결과가 나왔다. 중국인이 감염증 발생 및 확산의 원인이라는 결론은 위험하며, 정보 분석을 통해 감염병 확산을 예측하고 효과적으로 대처할 수 있다는 사실을 알리기 위한 분석의 사례이다.

4. 문화

  • MLB의 머니볼 이론 및 데이터 야구

머니볼 이론이란 경기 데이터를 철저하게 분석해 오직 데이터를 기반으로 적재적소에 선수들을 배치해 승률을 높인다는 게임 이론이다. 이는 미국 메이저 리그 베이스볼에 오클랜드 어스 레틱스의 구단장 빌리 빈이 리그 전체 25위에 해당하는 낮은 구단 지원금 속에서도 최소비용으로 최대 효과를 거둔 상황에서 유래되었다. 최근 들어서 과학기술 및 카메라 기술의 발달로 더욱 정교한 데이터의 수집이 가능해졌으며 투구의 궤적 및 투수의 그립, 타구 방향, 야수의 움직임까지 잡아낼 수 있게 되었다. 이처럼 기존의 정형 데이터뿐만 아닌 비정형 데이터의 수집과 분석, 활용을 통해 최근 야구경기에서 빅데이터의 중요성은 더욱 커지고 있다.

5. 과학기술

  • 데이터 마이닝

데이터 마이닝이란 기존 데이터베이스 관리 도구의 데이터 수집, 저장, 관리, 분석의 역량을 넘어서는 대량의 정형 또는 비정형 데이터 집합 및 이러한 데이터로부터 가치를 추출하고 결과를 분석하는 기술로, 수집되는 '빅데이터'를 보완하고 마케팅, 시청률 조사, 경영 등으로부터 체계화되어 분류, 예측, 연관분석 등의 데이터 마이닝을 거쳐 통계학적으로 결과를 도출해 내고 있다. 

데이터베이스 : 여러 사람이 공유하여 사용할 목적으로 체계화해 통합, 관리하는 데이터의 집합

비정형 데이터 : 미리 정의된 데이터 모델이 없거나 미리 정의된 방식으로 정리되지 않은 정보

1. 그래프 데이터베이스(Graph Database)란?

그래프 데이터베이스는 1) 노드(node 혹은 정점vertex), 2) 엣지(edge), 3) 속성(Property) 으로 구성된 데이터베이스의 유형입니다.

아래 그림에서 Id, Name, Age가 담긴 부분을 ‘노드(node)’로 부르고 그 안에 담긴 ‘키 — 값’ 으로 이뤄진 ‘Id: 1, Name: Alice, Age: 18’ 부분을 ‘속성(property)’, 노드 간의 관계가 표시된 화살표를 ‘엣지(edge)’라고 합니다.

출처: 위키백과 ‘그래프 데이터베이스'

2. 그래프데이터의 장점

(1) 빅데이터/실시간 데이터 분석에 용이함

: 기존 관계형데이터베이스가 표(table)로 저장되어 있어 데이터 간의 의미해석을 위해 별도의 데이터 시각화 작업을 필요로 했다면, 그래프데이터는 데이터 자체가 ‘점 — 선’으로 저장되어 있고 특정 속성에 따라 연결관계를 바로 확인할 수 있기 때문에 대량의 빅데이터/실시간 데이터 분석에 용이하다는 장점이 있습니다.

(2) 데이터 저장의 유연성

: 데이터 추가 시 기존 관계형데이터베이스에서는 테이블의 컬럼 항목, Primary key 확인, foreign key 연동 테이블 확인 등 데이터베이스의 안정성을 위해 복잡한 단계를 거쳐야했다면, 그래프데이터는 새로운 데이터가 담긴 노드를 추가하고 다른 데이터들과의 관계를 엣지로 연결하기만 하면 데이터 추가가 완료되기 때문에 데이터 저장에 매우 유연하다는 장점을 가집니다.

(3) 빠른 질의(Query) 속도

: 그래프데이터의 대표적인 예시로 소셜네트워크 데이터를 들 수 있는데, 특정 인물의 친구의 친구 데이터를 조회하거나 이커머스 쇼핑몰에서 한 고객의 여러 쇼핑몰의 주문데이터를 확인해야 하는 등 관계의 복잡성이 올라가는 데이터를 조회해야 할 때, 기존 관계형데이터베이스의 경우 분석가가 전체 데이터베이스 구조를 파악한 다음 조인(Join)쿼리 등을 사용해 데이터를 가져와야 하고 관계가 복잡할수록 쿼리도 복잡해지는 단점을 가지는 반면, 그래프데이터는 데이터 객체(노드)들 간의 관계가 엣지로 이어져있기 때문에 처음 검색 노드와 관련 엣지만 파악하면 연결데이터를 빠르게 찾을 수 있다는 장점이 있습니다.

3. 그래프 데이터베이스(Graph Database) 활용 사례

그래프 데이터가 주목을 받게 된 이유는 ‘빅데이터와 실시간 데이터 활용의 증가’와 관련이 깊습니다.

대표적으로 아래와 같은 서비스들이 있습니다.

  • 비트나인(Bitnine) 의 AgensGraph
  • AWS 의 Amazon Neptune
  • Franz의 AllegroGraph

비트나인의 AgensGraph는 2017년 UN의 세계식량계획(WFP) 연구 중 아프리카 기아문제 해결에 활용되었는데, 아프리카 지역별로 어떤 영양소가 부족한지 ‘영양소별 섭취 횟수’를 그래프 데이터로 시각화해 적정한 영양 공급에 기여했다고 합니다. (참고기사)

위 예시뿐 아니라, 이커머스 고객의 상품별 장바구니/결제 데이터를 확인해 연관도가 높은 추천 상품을 제시하거나, AI기반의 학습플랫폼(그래프 데이터로 학생의 영역별 부족한 부분을 빠르게 파악하여 맞춤 커리큘럼을 제시), 자산관리시스템(실시간으로 자산의 변동 상황을 그래프데이터로 파악하여 상황에 따른 데이터를 보여주고, 관리해주는 시스템), 이상거래탐지(입국자 경로 관계 분석으로 불법 밀수품 탐지, 계좌 간 거래 패턴 분석으로 숨겨진 대포통장 탐지)등이 있습니다.

마치며..

실시간으로 대용량의 데이터를 빠르게 저장하고 분석할 수 있는 구조이기 때문에 디지털 서비스 이용이 증가함에 따라 그래프데이터의 활용도도 높아져 세계적으로 관심을 받고 있는 분야라고 합니다.

비트나인이 곧 코스닥 상장에 속도를 낸다고 하는데, 이 부분도 흥미로운 점인 것 같습니다.

이상으로, [ 그래프 데이터베이스(Graph Database)개념과 활용사례 ] 포스팅을 마칩니다. 다음에 더 흥미로운 주제로 찾아 뵙겠습니다.

감사합니다.