반응형

1장 데이터의 이해

1절  데이터와 정보

1. 데이터의 정의와 특성

가. 데이터의 정의

    ① 라틴어 dare(주다)의 과거 분사형으로 주어진 것이라는 의미

    ② 데이터는 추론과 추정의 근거를 이루는 사실이다.

    ③ 데이터는 단순한 객체로서의 가치뿐만 아니라 다른 객체와의 상호 관계 속에서 가치를 갖는다.

나. 데이터의 특성

    ① 존재적 특성

i.  객관적 사실

     당위적 특성

i.       추론, 예측, 전망, 추정을 위한 근거

다.    수요 조사나 실험, 검사, 측정 등을 통해 데이터를 수집, 축적하고 다양한 방법으로 분석하여 간단한 마케팅 리포트로부터 심도 있는 논문, 미래 예측을 위한 경영 전략 또는 정책을 수립하는 일련의 가치 창출 과정에서 기초를 이루는 것을 데이터라고 한다.

라.    양질의 데이터를 확보하지 못하면 잘못된 분석 결과를 얻음

마.    창의적인 데이터 메시업(Mashup)은 기존에 풀기 어려운 문제 해결에 도움

바.    공공부문에서 개방하고 있는 데이터는 교통 데이터, 물가 데이터, 의료 데이터 이다

2.     데이터의 유형   

형태 정성적 데이터(qualitative data) 정량적 데이터(quatitative data)
형식 언어, 문자  수치,도형,기호
회사 매출이 증가함  나이,몸무게,주가
  비정형 데이터 정형 데이터
  주관적 내용 객관적 내용
  통계 분석이 어려움 통계분석이 용이함
데이터베이스 특정 스키마가 없는 NoSQL DB사용 SQL 기반 관계형 DB사용
검색 구조화 되어있지 않아 찾기 어려움 쉽게 검색가능
저장위치 데이터 레이크 데이터 웨어하우스

      

유    형 내    용 예    시
정형 데이터 - 형태(고정된 필드)가 있으며, 연산이 가능함. 주로 관계형 데이터 베이스(RDBMS)에 저장됨
- 데이터 수집 난이도가 낮고 형식이 정해져 있어 처리가 쉬운 편
관계형데이터베이스, 스프레드시트, CSV
반정형 데이터 - 데이터 내부에 메타 데이터를 갖고 있으며 일반적으로 파일 형태로 저장
- 형태(스키마, 메타데이터)가 있으며, 연산이 불가능. 주로 파일로 저장됨
메타데이터:
l  데이터에 관한 구조화된 데이터로 다른 데이터를 설명해 주는 데이터
l  데이터에 대한 데이터로써 하위 레벨의 데이터를 설명/기술하려는 것
- 데이터 수집 난이도가 중간. 보통 API 형태로 제공되기 때문에 데이터 처리 기술(파싱)이 요구됨

XML, HTML, JSON
XML (Extensible Markup Language)
다목적 마크업언어 (태그를 이용한 언어) 이다.
인터넷에 연결된 시스템끼리 데이터를 쉽게 주고 받을 수 있게 하여 HTML의 한계를 극복할 목적으로 만들어졌다
XML 기반 언어는 XHTML, SVG 등이 있다.
비정형데이터 - 형태가 없으며, 연산이 불가능. 주로 NoSQL 에 저장됨
- 데이터 수집 난이도가 높으며 텍스트 마이닝 혹은 파일일 경우 파일을 데이터 형태로 파싱해야 하기 떄문에 수집 데이터 처리가 어려움
- 데이터 내부에 메타 데이터를 갖고 있으며 일반적으로 파일 형태로 저장(X)
소셜데이터, 영상, 이미지, 음성, 텍스트

3. 지식경영의 핵심 이슈

가. 데이터는 지식 경영의 핵심 이슈인 암묵지와 형식지의 상호작용에 있어 중요한 역할을 한다.

나. 암묵지

    ① 의미: 학습과 경험을 통해 개인에게 체화되어 있지만 겉으로 드러나지 않는 지식

    ② : 김장 담그기, 자전거 타기

    ③ 특징: 사회적으로 중요하지만, 다른 사람에게 공유되기 어렵다

    ④ 상호작용: 공통화. 내면화

    ⑤ 개인에게 축적된 내면화된 지식-> 조직의 지식으로 공통화

다. 형식지

    ①  의미: 문서나 매뉴얼처럼 형상화된 지식

    ②  : 교과서, 비디오, DB

    ③  특징: 전달과 공유가 용이

    ④  상호작용: 표출화, 연결화

    ⑤  표출화: 개인에게 내재된 경험을 객관적인 데이터로 문서나 매체에 저장. 가공. 분석하는 과정

    ⑥  언어, 기호, 숫자로 표출화된 지식 -> 개인의 지식으로 연결화

라. 암묵지와 형식지의 상호작용 관계: 공통화->표출화->연결화->내면화

4.  데이터와 정보의 관계

가. DIKW의 정의

구  분 내  용
데이터(Data) i. 개별 데이터 자체로는 의미가 중요하지 않은 객관적인 사실
ii. 존재 형식을 불문하고, 타 데이터와의 상관관계가 없는 가공하기 전의 순수한 수치나 기호를 의미
예) A마트는 100원에, B마트는 200원에 연필을 판매한다.
정보(Information) i.  데이터의 가공, 처리와 데이터간 연관관계 속에서 의미가 도출되는 것
ii. (정보)는 데이터의 가공 및 상관 관계간 이해를 통해 패턴을 인식하고 그 의미를 부여한 데이터
iii. 지난 1년 매출의 50% 8월에 집중되어 있다
iv. 지난 1년 매출은 1월에서 8월까지 증가하였고, 12월까지 다시 증가하였다
v.  8 A상품 구매 고객의 80% 40대 여성 고객으로 대부분 회사원이다
예) A마트의 연필이 더 싸다.
지식(Knowledge) i. 데이터를 통해 도출된 다양한 정보를 구조화하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 고유의 지식으로 내재화된 것
ii. 상호 연결된 정보 패턴을 이해하여 이를 토대로 예측한 결과물
iii. B 사이트보다 가격이 상대적으로 저렴한 A사이트에서 USB를 사야겠다.
iv. 날씨가 따뜻해지고, 지점을 확장하여 올 8월 매출액은 3000만원으로 예상한다.
예) 상대적으로 저렴한 A마트에서 연필을 사야겠다.
지혜(Wisdom) i.  지식의 축적과 아이디어가 결합된 창의적인 산물
ii. 근본 원리에 대한 깊은 이해를 바탕으로 도출되는 창의적 아이디어
예) A마트의 다른 상품들도 B마트보다 쌀 것이라고 판단한다.

 

나. DIKW 피라미드

 데이터->정보->지식을 통해 최종적으로 지혜를 얻어내는 과정을 계층적으로 설명하고 있다.

 개별 데이터 자체로는 의미가 중요하지 않은 객관적 사실에서 데이터를 가공 및 처리하여 정보, 지식, 지혜, 기호(X) 를 얻을 수 있다.

 

2절   데이터베이스 정의와 특징

1.  용어의 연혁

2.  데이터베이스의 정의

가. 1차 개념 확대: 정형 데이터 관리

 EU

체계적이거나 조직적으로 정리되고 전자식 또는 기타 수단으로 개별적으로 접근할 수 있는 독립된 저작물, 데이터 또는 기타 소재의 수집물

 국내 저작권법

소재를 체계적으로 배열 또는 구성한 편집물로써 개별적으로 그 소재에 접근하거나 검색할 수 있도록 함

나. 2차 개념 확대

 국내 컴퓨터 용어 사적

동시에 복수의 적용 업무를 지원할 수 있도록 복수 이용자 요구에 대응해서 데이터를 받아들이고 저장, 공급하기 위하여 일정한 구조에 따라 편성된 데이터의 집합

 국내 Wikipedia

관련된 레코드의 집합, 소프트웨어로는 데이터베이스관리시스템(DBMS)를 의미

 국내 데이터분석 전문가 가이드

문자, 기호, 음성, 화상, 영상 등 상호 관련된 다수의 콘텐츠를 정보 처리 및 정보통신 기기에 의하여 체계적으로 수집 추적하여 다양한 용도와 방법으로 이용할 수 있도록 정리한 정보의 집합체

3.  데이터베이스의 특징

가. 데이터베이스의 일반적인 특징(암기 필요)

데이터베이스 특징 설  명
통합된 데이터
(Integrated data)
동일한 내용의 데이터가 중복되어 있지 않는다는 의미
저장된 데이터
(stored data)
자기 디스크나 자기 테이프 등과 같이 컴퓨터가 접근할 수 있는 저장 매체에 저장되는 것을 의미
공용 데이터
(shared data)
여러 사용자가 서로 다른 목적으로 데이터를 공동으로 이용한다는 것을 의미
변화되는 데이터
(changable data)
데이터베이스에 저장된 내용은 곧 데이터베이스의 현 시점에서의 상태를 의미, 새로운 데이터의 삽입, 갱신, 삭제로 항상 변화하여도 항상 현재의 정확한 데이터를 유지해야 함
인덱스 i. 데이터베이스내의 데이터를 신속하게 정렬하고 탐색하게 해주는 구조
ii.데이터베이스의 테이블에서 고속의 검색동작뿐만 아니라 레코드 접근과 관련 효율적인 순서 매김 동작에 대한 기초를 제공     

         

나.    다양한 측면에서의 특징

     정보 축적 및 전달 측면

     정보 이용 측면

     정보 관리 측면

     정보기술 발전 측면

     경제 산업 측면

 

3절   데이터베이스의 활용

1.     기업 내부 데이터베이스

가.    1980년대 기업내부 데이터베이스

  OLTP OLAP
약어 On-Line Transaction Processing On-Line Analytical Processing
정의 여러 단말에서 보내온 메시지에 따라 호스트 컴퓨터가 데이터베이스를 엑세스하고 바로 처리 결과를 돌려보내는 형태
데이터 베이스를 수시로 갱신
다양한 비즈니스 관점에서 쉽고 빠르게 다차원적인 데이터에 접근하여 의사 결정에 활용할 수 있는 정보를 얻을 수 있게 해주는 기술
다차원의 데이터를 대화식으로 분석하기 위한 기술
데이터 구조 복잡 단순
데이터 갱신 동적으로 순간적 정적으로 주기적
응답시간 수 초 이내 수초에서 몇 분 사이
데이터 범위 수 십일 전후 오랜 기간 저장
데이터 성격 정규적인 핵심 데이터 비정규적인 읽기 전용 데이터
데이터 크기 수 기가 바이트 수 테라 바이트
데이터 내용 현재 데이터 요약된 데이터
데이터 특징 트랜젝션 중심 주제 중심
데이터 엑세스 빈도 높음 보통
질의 결과 예측 주기적이며 예측 가능 예측하기 어렵다

 

나.2000년대 기업내부 데이터베이스

    ① CRM(Customer Relationship Management, 고객 관계 관리)

        i. 기업이 고객과 관련된 내/외부 자료를 분석 통합해 고객 중심 자원을 극대화하고, 이를 토대로 고객 특성에 맞게

           마케팅 활동을 계획, 지원, 평가하는 과정

        ii. 단순한 정보의 수집에서 탈피, 분석 중심의 시스템 구축 지향

        iii.기업의 내부 고객들만을 대상으로 한 정보시스템(X)

    ② SCM(Supply Chain Management, 공급망 관리)

        i.기업에서 원재로의 생산, 유통 등 모든 공급망 단계를 최적화해 수요자가 원하는 제품을 원하는 시간과 장소에 제공하는 것

        ii.(SCM)은 기업이 외부 공급업체 또는 제휴업체와 통합된 정보시스템으로 연계하여 시간과 비용을 최적화시키기 위한

           것으로, 자재 구매, 생산, 재고, 유통, 판매, 고객 데이터로 구성된다.

다. 각 분야별 내부 데이터베이스

    ①분야별 데이터베이스 개념

    ②분야별 데이터베이스 소개

 

분야 내용
제조부문 l  클라이언트/서버 기반의 내부 정보시스템이 웹기반의 데이터베이스로 전환되고 있다.
ERP (Enterprise Resource Planning)
-인사, 재무, 생산 등 기업의 전 부문에 걸쳐 독립적으로 운영되던 각종 관리 시스템의 경영자원을 하나의 통합시스템으로 재구축함으로써 생산성을 극대화하려는 경영혁신기법
-기업 전체의 경영자원의 효과적 이용이라는 관점에서 통합적으로 관리하고 경영의 효율화를 기하기 위한 시스템

BI (Business Intelligence)
- 의사결정에 활용하는 일련의 프로세스
-  데이터 기반 의사결정을 지원하기 위한 리포트 중심의 도구

CRM (Customer Relationship Management)
- 고객 중심 자원을 극대화

RTE (Real-Time Enterprise)
-  회사의 주요 경영정보를 통합관리하는 실시간 기업의 새로운 기업경영시스템이다.
-  회사 전부문의 정보를 하나로 통합함으로써 경영자의 빠른 의사 결정을 이끌어 내려는 목적

Business Analytics
-  의사 결정을 위한 통계적이고 수학적인 분석에 초점을 둔 기법
금융부문 l  업무 프로세스 효율화나 통합시스템 구축으로 확산되고 있다.
 EAI (Enterprise Application Integration)
-  정보를 중앙 집중적으로 통합, 관리, 사용할 수 있는 환경 구현

 EDW (Enterprise Data Warehouse)
- DW (Data Warehouse)를 전사적으로 확장한 모델로 BPR CRM, BSC 같은 다양한 분석 애플리케이션을 위한 원천이 된다.
유통부문 KMS (Knowledge Management System)
- 지식관리시스템
- 조직 내 구성원들이 축적하고 있는 노하우 등 암묵적 지식을 형식지로 표출화 될 수 있도록 지원하는 등, 조직의 경쟁력향상을 위해 지식자원을 체계화하고 원활하게 공유가 될 수 있도록 지원하는 시스템

RFID (RF, Radio Frequency)
-  주파수를 이용해 ID를 식별하는 system

      

라.사회 기반구조로서의 데이터베이스

 개념

i.       사회 각 부분의 정보화가 본격화되면서 데이터베이스 구축이 활발하게 추진되었다.

     종류

i.       EDI (Electric Date Interchange)

l  각종 서류를 표준화된 양식을 통해 전송

ii.      VAN(Value Added Network, 부가가치통신망)

l  공중 전기통신사업자로부터 통신회선을 차용하여 독자적인 네트워크를 형성하는 것

iii.     CALS (Commerce at Light Speed)

l  전자상거래 구축을 위해 기업 내에서 비용 절감과 생산성 향상을 추구할 목적으로 시작된, 제품의 설계, 개발, 생산에서 유통, 패기에 이르기 까지 제품의 라이프 사이클 전반에 관련된 데이터를 통합하고 공유, 교환할 수 있도록 한 경영 통합 정보 시스템

     분야별 사회 기반 구조의 데이터베이스

i.       물류 부문

l  CVO (Commercial Vehicle Operation System, 화물 운송 정보)

l  PORT-MISI (항만 운영 정보 시스템)

l  KROIS (철도 운영 정보 시스템)

ii.      지리/교통부문

l  GISI (Geographic Information System 지리정보시스템)

l  RS (Remote Sensing, 원격탐사)

l  GPS (global Positioning System)

l  ITS (Intelligent Transport System 지능형 교통시스템)

l  LBS (Location Based Service 위치기반서비스)

l  SIM (Spatial Information Management 공간정보관리)

iii.     의료 부문

l  PACS (Picture Archiving and Communication System)

l  U헬스 (Ubiquitous Health)

iv.     교육 부문

l  NEIS (National Education Information System, 교육행정정보시스템)

 

2장  데이터의 가치와 미래

1절   빅데이터의 이해

1.     빅데이터의 이해

가.    빅데이터의 정의

     빅데이터를 보는 관점에 따른 정의

    i. 첫째, 3V로 요약되는 데이터 자체의 특성 변화에 초점을 맞춘 좁은 범위의 정의

    ii.      둘째, 데이터 자체뿐만 아니라 처리, 분석 기술적 변화까지 포함되는 중간 범위의 정의

    iii.     셋째, 인재, 조직 변화까지 포함한 넓은 관점에서의 빅데이터에 대한 정의

     3V

    i.       Volume(): 데이터의 규모 측면, 센싱데이터/비정형데이터

    ii.      Variety(다양성): 데이터 유형과 소스 측면, 정형/ 비정형데이터(영상, 사진)

    iii.     Velocity(속도): 데이터 수집과 처리 측면

     4V

    i.       Value (가치)

    ii.      Visualization (시각화)

    iii.     Veracity (정확성)

     빅데이터의 수집, 구축, 분석의 최종 목적은 새로운 통찰과 가치를 창출이다

     빅데이터는 일반적인 데이터베이스 소프트웨어로 저장, 관리, 분석할 수 있는 범위를 초과하는 규모의 데이터다

     빅데이터는 다양한 종류의 대규모 데이터로부터 저렴한 비용으로 가치를 추출하고 데이터의 초고속 수집, 발굴, 분석을 지원하도록 고안된 차세대 기술 및 아키텍처이다

     빅데이터는 데이터 양(Volume), 데이터 유형과 소스 측면의 다양성(Variety), 데이터 처리 측면에서 속도(Velocity)가 급격히 증가하면서 나타난 현상이다.

     빅데이터는 기존의 작은 데이터 처리분석으로 얻을 수 없었던 통찰과 가치를 하둡(Hadoop)을 기반으로 하는 대용량의 분산처리 기술을 통해 창출하는 방식이다(X)

 

나.    빅데이터 정의의 범주 및 효과

     데이터 변화

    i.       규모, 형태, 속도

     기술 변화:

    i.       데이터 처리, 저장, 분석, 기술 및 아키텍처

    ii.      클라우드 컴퓨팅 활용

     인재, 조직 변화

    i.       Data Scientist 같은 새로운 인재 필요

    ii.      데이터 중심 조직

2.     출현 배경과 변화

가.    빅데이터 출현 배경

     3가지 출현 배경

    i.       산업계: 고객 데이터 축적

    ii.      학계: 거대 데이터 활용, 과학 확산

    iii.     기술발전: 관련 기술의 발달

     ICT의 발전과 빅데이터의 출현

     고객데이터의 축적과 거대 데이터의 활용이 늘어남으로 필요한 기술 아키텍처 및 통계도구들의 발전, 모바일 혁명 등의 관련 기술의 발달을 들 수 있다.

     M2M, IOT와 같은 통신 기술의 발전

     하둡등 분산처리 기술의 발전

     트위터, 페이스북 등 SNS의 급격한 확산

     의료정보 등 공공 데이터 개방 가속화(X)

3.     빅데이터의 기능

가.    빅데이터에 거는 기대를 표현한 비유

     산업혁명의 석탄,

     21세기의 원유

     렌즈

     플랫폼

    i.       빅데이터의 기능으로 공동 활용의 목적으로 구축된 유,무형의 구조물 역할을 수행한다

    ii.      빅데이터가 다양한 서드 파티 비즈니스에 활용되면서 플랫폼 역할을 할 것으로 전망된다.

    iii.     페이스북은 2006F8 행사를 기점으로 자신들의 소셜그래프 자산을 외부 개발자들에게 공개하고 서드파티 개발자들이 페이스북 위에서 작동하는 앱을 만들기 시작하면서 (플랫폼) 역할을 하기 시작했다

    iv.     하둡은 대규모 분산 병렬 처리의 업계 표준으로 맵리듀스 시스템과 분산 파일 시스템인 HDFS로 구성된 (플랫폼) 기술이며, 선형적인 성능과 용량 확장성, 고장 감내성을 가지고 있다.

    v.      아마존은 S3, BC2 환경을 제공함으로써 (플랫폼)을 우한 클라우드 서비스를 최초로 실현하였다

 

4.     빅데이터가 만들어 내는 본질적인 변화

가.    과거에서 현재로의 변화

     사전 처리 -> 사후 처리

     표본 조사 -> 전수 조사

     ->

     인과관계 -> 상관관계

    i.       상관 관계를 통해 특정 현상의 발생 가능성이 포착되고, 그에 상응하는 행동을 하도록 추천되는 일이 점점 늘어나고 있다. 이처럼 데이터 기반의 상관 관계 분석 주는 인사이트가 인과 관계에 의한 미래 예측을 점점 압도해 가는 시대가 도래하게 될 것으로 전망된다.

나.    빅데이터가 만들어내는 변화

     가치가 있을 것이라고 예상되는 특정한 정보만 모아서 처리하는 것이 아니라, 가능한 많은 데이터를 모으고 그 데이터를 다양한 방식으로 조합해 숨은 정보를 찾아내는 방식이 중요해 진다.

     데이터의 규모가 증가함에 따라 사소한 몇 개의 오류 데이터는 분석결과에 영향을 미치지 않기 때문에 데이터세트에 포함하여 분석해도 상관없는 경우가 많아진다.

     인과관계의 규명없이 상관관계 분석 결과만으로 인사이트를 얻고 이를 바탕으로 수익을 창출할 수 있는 기회가 점차 늘어나고 있다.

     빅데이터의 등장으로 데이터 수집비용의 감소와 클라우드 컴퓨팅 기술의 발전으로 데이터 처리비용이 감소하게 되었다. 이로 인해 표본을 조사하는 기존의 지식 발견 방식에서 전수조사를 통해 샘플링이 주지 못하는 패턴이나 정보를 발견하는 방식으로 데이터 활용 방법이 변화되었다.

     데이터의 양이 증가하고 유형이 복잡해짐에 따라 수많은 데이터 중에서 분석에 필요한 데이터를 선정하기 위해 정교한 표본조사 기법의 중요성이 대두되고 있다(X)

 

2절   빅데이터의 가치와 영향

1.     빅데이터의 가치

가.    빅데이터의 가치 산정이 어려운 이유

     데이터 활용 방식

i.       데이터 활용 방식에서는 재사용이나 재조합, 다목적용 데이터 개발등이 일반화되면서 특정 데이터를 언제 어디서 누가 활용할 지 알 수 없게 되었다. 따라서 가치를 산정하는 것도 어려워졌다

     새로운 가치 창출

i.       기존에 없던 가치를 창출함에 따라 그 가치를 측정하기 어렵다

     분석 기술 발전

i.       현재는 가치가 없는 데이터일지라도, 추후에 새로운 분석 기법이 등장한다면 거대한 가치를 지닌 데이터가 될 수 있다.

     빅데이터 전문 인력의 증가로 다양한 곳에서 빅데이터가 활용되고 있기 때문이다.(X)

나.    빅데이터의 영향

     다양한 시장 주체들이 빅데이터를 활용함에 따라 소비자이면서 국민인 일반인들은 맞춤형 서비스를 저렴한 비용으로 이용하게 되고, 적시에 필요한 정보를 얻음으로써 다양한 형태로 기회 비용을 절약할 수 있어 사람들이 점점 스마트해지고 있다.

     기업: 혁신, 경쟁력 제고, 생산성 향상

     정부: 환경 탐색, 상황 분석, 미래 대응

     개인: 목적에 따른 활용

 

 

3절   비즈니스 모델

1.     빅데이터 활용 사례

가.    기업

     구글

i. 실시간 자동 번역 시스템,

ii.      사용자의 로그 데이터를 활용한 검색엔진 개발

     넷플릭스

i.       Cinematch시스템, 이용자의 콘텐츠 기호 파악하여 새로운 영화 추천

     라쿠텐 (X)

i.       Cinematch시스템, 이용자의 콘텐츠 기호 파악하여 새로운 영화 추천

     월마트

i.       소셜 미디어를 통해 고객 소비패턴 분석하는 월마드랩(Wallmart Labs) 운영

ii.      고객의 구매 패턴을 분석해 상품 진열에 활용

     자라

i.       일일 판매량을 실시간 테이터 분석으로 상품 수요를 예측

나.    정부

     정부는 실시간 교통 정보 수집, 기후 정보, 각종 지질 활동, 소방 서비스 등 다양한 국가 안전 확보 활동을 위해 실시간 모니터링을 활용하고 있다.

     미래 의제인 의료와 교육 개선을 위해 빅데이터를 활용해 해결책을 모색한다

다.    개인

     정치인은 선거 승리를 위해 사회관계망 분석을 통해 유세 지역을 선정하고, 해당 지역의 유권자에게 영향을 줄 수 있는 내용을 선정에 효과적인 선거 활동을 펼친다.

     가수는 팬들의 음악 청취 기록 분석을 통해 실제 공연에서 부를 노래 순서를 짜는데 활용한다.

라.    신용평가는 투자자 보호를 위하여 금융상품 및 신용공여 등에 대하여 그 원리금이 상환될 가능성과 기업 법인 및 간접투자기구등의 신용도를 평가하는 행위이며 핀테크 분야에서 빅데이터 활용이 활발하게 이루어지고 있다.

 

2.     빅데이터 활용 기본 테크닉

가.    빅데이터 기본 테크닉

     연관 규칙 학습

i.       변인들 간에 주목할 만한 상관관계가 있는지 찾아내는 방법

ii.      맥주를 사는 사람은 콜라도 같이 구매하는 경우가 많은가?

iii.     A 마트는 금요일 저녁에 맥주를 사는 사람은 기저귀도 함께 구매했다는 사실을 발견하고 두 가지 상품을 가까운 곳에 진열하기로 결정했다.

     유형 분석

i.       문서를 분류하거나 조직을 그룹으로 나눌 때, 또는 온라인 수강생들을 특성에 따라 분류할 때 사용

ii.      사용자가 어떤 특성을 가진 집단에 속하는지 알고자 할 때 사용

iii.     택배 차량을 어떻게 배차하는 것이 효율적인가? (X)

     유전자 알고리즘

i.       최적화가 필요한 문제의 해결책을 자연 선택, 돌연 변이 등과 같은 메커니즘을 통해 점진적을 진화시켜 나가는 방법

ii.      (유전자 알고리즘)은 생명의 진화를 모방하여 최적해(Optimal Solution)을 구하는 알고리즘으로 존 홀랜드(John Holland)1975년에 개발하였다

iii.     (유전자 알고리즘)최대의 시청률을 얻으려면 어떤 시간대에 방송해야 하는가?’ 와 같은 문제를 해결할 떄 사용된다

iv.     (유전자 알고리즘)은 어떤 미지의 함수 Y=f(x)를 최적화하는 해 x를 찾기 위해, 진화를 모방한 (Simulated evolution) 탐색 알고리즘이라고 할 수 있다.

     기계 학습

i.       훈련 데이터로부터 학습한 알려진 특성을 활용해 예측하는 방법

     회귀 분석

i.       독립 변수를 조직함에 따라 종속 변수가 어떻게 변하는지를 보면서 두 변인의 관계를 파악할 때 사용

ii.      고객의 만족도가 충성도에 어떤 영향을 미치는가?

     감정 분석

i.       특정 주제에 대해 말하거나 글을 쓴 사람의 감정을 분석

     감성 분석

i.       특정 주제에 대한 사용자의 긍정,부정 의견을 분석한다

ii.      주로 온라인 쇼핑몰에서 사용자의 상품명에 대한 분석이 대표적 사례이다

iii.     사용자가 사용한 문장이나 단어가 분석 대상이 된다

iv.     사용자간의 쇼셜 관계를 알아내고자 할 때 이용한다(X)

     소셜 네트워크 분석

i.       특정인과 다른 사람이 몇 촌 정도의 관계인가를 파악할 때 사용하고 영향력 있는 사람을 찾아낼 때 사용

ii.      사용자간의 쇼셜 관계를 알아내고자 할 때 이용한다

iii.     친분관계가 승진에 어떤 영향을 미치는가?

3.     플랫폼 비즈니스 모델

가.    상품, 서비스, 기술 등의 기반 위에 다른 이해관계자들이 보완적이 상품, 서비스, 기술을 제공하는 생태계 구축을 목표로 하는 비즈니스 모델

4절   위기 요인과 통제 방안

1.     빅데이터 시대의 위기 요인

가.    사생활 침해

     개인정보가 포함된 데이터를 목적 외에 활용할 경우 사생활 침해를 넘어 사회, 경제적 위협으로 변형 될 수 있다.

나.    책임 원칙 훼손

     빅데이터 기본 분석과 예측 기술이 발전하면서 정확도가 증가한 만큼, 분석 대상이 되는 사람들은 예측 알고리즘의 희생양이 될 가능성도 증가한다.

     민주주의 국가에서는 잠재적 위협이 아닌 명확한 결과에 대한 책임을 묻고 있어 이에 따른 원리를 훼손할 가능성이 있다.

다.    데이터 오용

     빅데이터는 일어난 일에 대한 데이터에 의존하기 때문에 이를 바탕으로 미래를 예측하는 것은 적지 않은 정확도를 가질 수 있지만 항상 맞을 수는 없다. 또한 잘못된 지표를 사용하는 것도 빅데이터의 피해가 될 수 있다.

2.     위기 요인에 따른 통제 방안

가.    동의에서 책임으로

     빅데이터에 의한 사생활 침해 문제를 해결하기에는 부족한 측면이 많고, 번 개인정보 제공 동의를 하는 비효율적인 단계를 줄이고자 개인정보를 사용하는 사용자의 책임으로 해결하는 방안을 제시하였다

     사생활 침해 문제를 해결 방안 -> 개인정보 제공 동의에서 정보 사용자 책임제로 변환

나.    결과 기반 책임 원칙 고수

     책임 원칙 훼손 위기 요인에 대한 통제 방안으로 기존의 원칙을 좀 더 보강하고 강화할 필요가 있으며, 예측 자료에 의한 불이익을 당할 가능성을 최소화하는 장치를 마련하는 것이 필요하다

     책임 원칙 훼손 위기 요인에 대한 통제 방안 -> 결과 기반 책임 원칙 고수

다.    알고리즘 접근 허용

     데이터 오용의 위기 요소에 대한 대응책으로 알고리즘에 대한 접근권을 제공하여 예측 알고리즘의 부당함을 반증할 수 있는 방법을 공개할 것을 주문한다.

     데이터 오용의 위기 요소에 대한 대응책 -> 알고리즘 접근 허용

라.    빅데이터가 발생시키는 문제를 중간자 입장에서 중재하며 해결해 주는 알고리즈미스트도 새로운 직업으로 부상하게 될 것이다.

 

5절   미래의 빅데이터

1.     빅데이터 활용의 3요소

가.    기본 3요소

     데이터

모든 것을 데이터화하는 현 추세로 특정 목적없이 축적된 데이터를 통한 창의적인 분석이 가능해져 새로운 가치로 부상하고 있다.

     기술

대용량의 데이터를 빠르게 처리하기 위한 알고리즘의 진화와 함께 스스로 학습하고 데이터를 처리할 수 있는 인공지능 기술이 출현하였다.

     인력

빅데이터를 처리하기 위한 데이터 사이언티스트와 알고리즈미스트의 역할을 통해 다각적 분석을 통한 인사이트 도출이 중요해지고 있다.

 

3장  가치 창조를 위한 데이터 사이언스와 전략 인사이트

1절   빅데이터 분석과 전략 인사이트

1.     빅데이터 열풍과 회의론

빅데이터의 열풍을 일종의 거품 현상으로 보는 회의론으로 인해 빅데이터 분석에서 찾을 수 있는 수많은 가치를 제대로 발굴해 보기도 전에 그 활용 자체를 사전에 차단해 버릴 수 있다.

2.     빅데이터 회의론의 원인과 진단

가.    투자효과를 거두지 못했던 학습효과 -> 과거의 고객관계관리(CRM)

     도입만하면 모든 문제를 한번에 해소할 것처럼 강조되었지만, 어떻게 활용하고 어떻게 가치를 뽑아내야 할지 난감해 함

나.    빅데이터 성공사례가 기존 분석 프로젝트를 포함해 놓은 것이 많다.

다.    데이터에서 가치, 즉 통찰을 이끌어내 성과를 창출하는 것이 관건이며, 분석을 통해 가치를 만드는 것에 집중해야 한다.

3.     빅데이터 분석, “Big”이 핵심이 아니다.

가.    빅데이터에 대한 관심 증대

데이터 기반의 통찰의 중요성에 대한 공감대 상승과 동시에 긍정적 효과를 기대한다

나.    빅데이터 프로젝트에 거는 기대

기존 프로세스의 자동화를 우선 시행한 후 점차적으로 거시적이고, 전략적인 가치를 이끌어 낼 수 있는 것으로 기대한다.

다.    빅데이터 분석의 가치

     데이터는 크기의 이슈가 아니라, 거기에서 어떤 시각과 통찰을 얻을 수 있느냐의 문제가 중요하다

     전략과 비즈니스의 핵심 가치에 집중하고 이와 관련된 분석 평가지표를 개발하고 이를 통해 효과적으로 시장과 고객 변화에 대응할 수 있을 때 빅데이터 분석은 가치를 줄 수 있다.

 

4.     전략적 통찰이 없는 분석의 함정

가.    단순히 분석을 많이 하는 것이 곧바로 경쟁우위를 가져다 주지는 않는다.

나.    전략적인 통찰력을 가지고 분석하고 핵심적인 비즈니스 이슈에 집중하여 데이터를 분석하고 차별적인 전략으로 기업을 운영해야 한다.

5.     일차원적인 분석 vs 전략 도출 위한 가치 기반 분석

가.    산업별 분석 애플리케이션

     금융서비스: 신용점수 산정, 사기 탐지, 가격 책정, 프로그램 트레이딩, 클레임 분석

     병원: 가격 책정, 고객 로열티, 수익 관리

     에너지: 트레이딩, 공급/수요 예측

     정부: 사기 탐지, 사례관리, 범죄 방지, 수익 최적화

나.    일차적인 분석의 문제점

     일차적인 분석을 통해서도 해당 부서나 업무 영역에서는 상당한 효과를 얻을 수 있지만 일차적인 분석만으로는 환경변화와 같은 큰 변화에 제대로 대응하거나 고객 환경의 변화를 파악하고 새로운 기회를 포착하기 어렵다

다.    전략 도출 가치 기반 분석

     전략적인 통찰력을 창출에 포커스를 뒀을 때, 분석은 해당 사업에 중요한 기회를 발굴하고, 주요 경영진의 지원을 얻어낼 수 있으며 이를 통해 강력한 모멘텀을 만들어 낼 수 있다.

     활용 범위를 더 넓고 전략적으로 변화시켜야 한다.

     사업성과를 견인하는 요소들과 차별화를 꾀할 기회에 대해 전략적 인사이트를 주는 가치기반 분석단계로 나아가야 한다.

2절    전략 인사이트 도출을 위한 필요 역량

1.     데이터 사이언스의 의미와 역할

가.    의미

     데이터 공학, 수학, 통계학, 컴퓨터 공학, 시각화, 헤커의 사고방식, 해당분야의 전문지식을 종합한 학문이다.

     데이터로부터 의미 있는 정보를 추출해내는 학문

 

나.    역할

     비즈니스의 성과를 좌우하는 핵심이슈에 답을 하고, 사업의 성과를 견인

     소통력이 필요

2.     데이터 사이언스의 구성요소

가.    데이터 사이언스의 영역

     분석적 영역: Analytics

     데이터 처리와 관련된 IT 영역:

i.       데이터 웨어하우징

ii.      분산 컴퓨팅

iii.     파이썬 프로그래밍

iv.     데이터 시각화(X)

     비즈니스 컨설팅 영역:

i.       비즈니스 분석

ii.      데이터 시각화

나.    데이터 사이언스의 역할

     데이터 홍수 속에서 헤엄을 치고, 데이터 소스를 찾고, 복잡한 대용량 데이터를 구조화, 불완전한 데이터를 서로 연결해야 한다.

     데이터 사이언티스트가 갖춰야 할 역량의 한가지는 강력한 호기심이다.

     데이터 사이언티스트는 스토리텔링, 커뮤니케이션, 창의력, 열정, 직관력, 비판적 시각, 글쓰기능력, 대화능력을 갖춰야 한다.

3.     데이터 사이언티스트의 요구 역량

가.    Hard Skill

     빅데이터에 대한 이론적 지식

     분석 기술에 대한 숙련

나.    Soft Skill

     통찰력 있는 분석

     설득력 있는 스토리텔링 능력

     다분야 간 커뮤니케이션 능력

     뉴럴네트워크 최적화 능력(X)

     알고리즘에 의해 부당하게 피해를 입은 사람을 구제하는 능력(X, 알고리즈미스트)

다.    데이터 사이언티스트가 갖춰야할 역량은 빅데이터의 처리 및 분석에 필요한 이론적 지식과 기술적 숙련에 관련된 능력인 (Hard) Skill 과 데이터 속에 숨겨진 가치를 발견하고 새로운 발전 기회를 만들어 내기 위한 능력인 (Soft) Skill 로 나뉘어진다

4.     데이터 사이언스: 과학과 인문의 교차로

분석기술보다 중요한 것은 소프트 스킬로 전략적 통찰을 주는 분석은 단순 통계나 데이터 처리와 관련된 지식 외에도 스토리텔링, 커뮤니케이션, 창의력, 열정, 직관력, 비판적 시각, 글쓰기 능력, 대화 능력 등 인문적 요소가 필요하다.

 

5.     전략적 통찰력과 인문학의 부할

가.    통찰력 있는 분석

     직관과 전략, 경영, 프레임워크 경험의 혼합을 통해 통찰력있는 분석을 수행

     본인 회사 뿐 아니라, 전체 업계의 방향과 고객이 무엇을 중시하는지에 대한 이해가 필요

나.    인문학의 열풍

     외부 환경적 측면에서 본 인문학 열풍의 이유

i.       컨버전스 -> 디버젼스

단순 세계화에서 복잡한 세계화로의 변화

ii.      생산 -> 서비스

비즈니스 중심이 제품생산에서 서비스로 이동

iii.     생산 -> 시장 창조

공급자 중심의 기술 경쟁에서 무형자산의 경쟁으로 변화

iv.     빅데이터 분석 기법의 이해와 분석 방법론 확대(X)

 

3절   빅데이터 그리고 데이터 사이언스의 미래

1.     빅데이터의 시대

가.    디지털 환경의 전진과 더불어 실로 엄청난 데이터가 생성되고 있다

나.    빅데이터 분석은 선거결과에 결정적인 영향을 미칠 수 도 있다. 기업의 측면에서는 비용 절감, 시간 절약, 매출 증대, 고객서비스 향상, 신규 비즈니스 창출, 내부 의사결정 지원등에 있어 상당한 가치를 발휘하고 있다.

 

2.     빅데이터 회의론을 넘어 가치 패러다임의 변화

가.    과거

     Digitalization

     아날로그 세상을 어떻게 효과적으로 디지털화하는지가 과거의 가치 창출 원천

나.    현재

     Connection

     디지털화된 정보와 대상들은 서로 연결 시작

     연결을 더 효과적이고 효율적으로 제공하는지가 성공요인

다.    미래

     Agency

     복잡한 연결을 어떻게 효과적이고 믿을 수 있게 관리하는지가 이슈

3.     데이터 사이언스의 한계와 인문학

가.    데이터 사이언스의 한계

     분석과정에서는 가정 등 인간의 해석이 개입되는 단계를 반드시 거친다

     분석결과가 의미하는 바는 사람에 따라 전혀 다른 해석과 결론을 내릴 수 있다.

     아무리 정량적인 분석이라도 모든 분석은 가정에 근거한다는 사실이다.

나.    데이터 사이언스와 인문학

     인문학을 이용하여 빅데이터와 데이터 사이언스가 데이터에 묻혀 있는 잠재력을 풀어내고, 새로운 기회를 찾고, 누구도 보지 못한 창조의 밑그림을 그릴 수 있는 힘을 발휘하게 될 것이다.

 

4절   최신 빅데이터 상식

1.     DBMS SQL

가.    DBMS (Data Base Management System)

     DBMS 데이터베이스를 관리하여 응용 프로그램이 데이터베이스를 공유하며 사용할 수 있는 환경을 제공하는 소프트웨어

     데이터베이스 관리시스템 종류

i.       관계형 DBMS

l  데이터를 컬럼(column)과 로우(row)를 이루는 하나 이상의 테이블로 정리하여 고유키가 각 로우를 식별한다.

ii.      객체지향 DBMS

l  정보를 객체형태로 표현하는 데이터베이스 모델

l  데이터 및 멀티미디어 데이터 등 복잡한 데이터 구조를 표현, 관리할 수 있는 데이터베이스 관리 시스템

iii.     네트워크 DBMS

l  레코드들이 노드로, 레코드들 사이의 관계가 간선으로 표현되는 그래프를 기반으로 하는 데이터베이스 모델

iv.     계층형 DBMS

l  트리 구조를 기반으로 하는 계층 데이터베이스 모델

나.    SQL (Structured Query Language)

     SQL

i.       데이터베이스의 하부 언어로, 단순한 질의 기능 뿐만 아니라 완전한 데이터의 정의와 조작 기능을 갖추고 있다.

ii.      영문 문장과 비슷한 구조

     SQL 집계함수

i.       AVG, SUM, STDEV, MIN, MAX

l  수치형

ii.      COUNT:

l  수치형, 문자형

l  어떠한 데이터의 타입에도 사용 가능

l  데이블의 트정 조건이 맞는 것의 개수를 반환

     SELECT NAME, GENDER FROM CUSTOMERS WHERE AGE (BETWEEN) 20 AND 30

     DML (Data Manipulation Language)

i.       SELECT , INSERT, UPDATE, DELETE, CREATE(X)

     DDL (Data Definition Language)

i.       CREATE, ALTER, DROP, RENAME, TRUNCATE 

     DLC (Data Control Language)

i.       GRANT, REVOKE

     TCL (Transaction Control Language)

i.       COMMIT, ROLLBACK, SAVEPOINT

2.     Data에 관련한 기술

가.    개인정보 비식별 기술

비식별 기술이란 데이터 셋에서 개인을 식별할 수 있는 요소를 전부 또는 일부를 삭제하거나 다른 값으로 대체하는 등의 방법으로 개인을 알아 볼 수 없도록 하는 기술을 일컫는다.

비식별기술 비식별기술 예시
데이터마스킹 i. 데이터의 길이, 유형, 형식과 같은 속성을 유지한 채, 새롭고 읽기 쉬운 데이터를 익명으로 생성하는 기술
ii. 개인 정보 식별이 가능한 특정 데이터 값을 삭제 처리(X)
홍길동,35세,서울 거주,한국대 재학
-->홍**,35세,서울 거주, **대학 재학
가명 처리 i. 개인정보 주체의 이름을 다른 이름으로 변경하는 기술, 다른 값으로 대체할 시 일정한 규칙이 노출되지 않도록 주의해야 함
ii. 개인 식별이 가능한 데이터에 대하여 직접적으로 식별할 수 없는 다른 값으로 대체
홍길동,35세,서울 거주,한국대 재학
-->임꺽정,30대,서울 거주, 국내대학 재학
총계 처리 i. 데이터의 총합 또는 평균값을 보임으로서 개별 데이터의 값을 보이지 않도록 함. , 특정 속성을 지닌 개인으로 구성된 단체의 속성 정보를 공개하는 것은 개인 정보를 공개하는 것과 마찬가지의 결과를 보임을 주의한다.  
데이터값 삭제 i. 데이터 공유, 개방 목적에 따라 데이터 셋에 구성된 값 중에 필요 없는 값 또는 개인 식별에 중요한 값을 삭제.  
데이터 범주화 i. 데이터의 값을 범주의 값으로 변형하여 값을 숨김 (홍길동->홍씨, 30~40)
ii. 단위 식별 정보를 해당 그룹의 대표 값으로 변환
 
난수화 i. 사행활 침해를 막기 위해 개인 정보를 무작위 처리하는 등 데이터가 본래 목적 외에 가동되고 처리되는 것을 방지하는 기술  

 

나.    무결성과 레이크

     데이터 무결성(Data Integrity)

    i. 데이터베이스 내의 데이터에 대한 정확한 일관성, 유효성, 신뢰성을 보장하기 위해 데이터 변경/수정 시 여러 가지 제한을 두어 데이터의 정확성을 보증하는 것

    ii.무결설제한의 유형

        - 개체 무결성(Entity integrity)

        - 참조 무결성(Reference integrity)

        - 범위 무결성(Domain integrity)

②     데이터 레이크 (Data Lake)

i.       수 많은 정보 속에서 의미 있는 내용을 찾기 위해 방식에 상관없이 데이터를 저장하는 시스템으로, 대용량의 정형 및 비정형 데이터를 저장할 뿐만 아니라 접근도 쉽게 할 수 있는 대규모 저장소

ii.      지난 몇 년간 여러 사일로 대신 하나의 데이터 소스를 추구하는 경향이 생겼다. 전사적으로 쉽게 인사이트를 공유하는 데 도움이 되기 때문이다. 다시 말해 별도로 정제되지 않은 자연스러운 상태의 아주 큰 데이터 세트인 (데이터 레이크)를 기업들이 구현하는 것은 2017년 새롭게 등장한 트렌드가 아니다. 그러나, 2017년 은 이를 적절히 관리해 운영하는 첫해가 될 전망이다.

iii.     Apache Haddop, Teradata Integrated Big Data Platform 1700등과 같은 플랫폼으로 구성된 솔루션을 제공

     데이터 웨어하우스

i.       기업내의 의사 결정 지원 어플리케이션에 정보 기반을 제공하는 하나의 통합된 저장 공간

ii.      데이터의 주제 지향성, 데이터 통합, 데이터의 시계열성, 데이터의 비휘발성이라는 4가지 특성을 갖는다.

iii.     데이터웨어 하우스의 데이터들은 전사적 차원에서 일괄된 형식으로 정의된다

iv.     데이터 웨어하우스에서 관리되는 데이터들은 시간의 흐름에 따라 변화하는 값을 저장한다

v.      데이터 웨어하우스에서는 특정 주제에 따라 데이터들이 분류, 저장 관리된다.

vi.     기업의 의사 결정 과정을 지원하기 위한 주제 중심적으로 통합적이며 시간성을 가지는 비휘발성 데이터의 집합을 (데이터 웨어하우스, Data Warehouse)라고 한다.

vii.    데이터웨어하우스에서는 데이터의 지속적 갱신에 따른 무결성 유지가 무엇보다 중요하다(X)

 

3.     빅데이터 분석 기술

가.    하둡(Hadoop)

     여러 컴퓨터를 하나인 것처럼 묶어 대용량 데이터를 처리하는 기술

     분산 파일 시스템을 통해 수 천대의 장비에 대용량 파일을 저장할 수 있는 기능

     Map Reduce HDFS에 저장된 대용량의 데이터를 대상으로 SQL 을 이용해 사용자 질의를 실시간 처리

     하둡의 부족한 기능을 서로 보완하는 하둡 에코시스템이 등장하여 다양한 솔루션을 제공한다.

나.    Apache Spark

     실시간 분산형 컴퓨팅 플랫폼

     스칼라로 작성되어 있지만, 스칼라, 자바, R, 파이션 API 지원

     In-Memory 방식으로 하둡에 비해 처리 속도가 빠르다.

다.    Smart Factory

     공장내 설비와 기계에 사물인터넷(IOT) 가 설치되어, 공정 데이터가 실시간으로 수집되고, 데이터 기반한 의사결정이 이뤄짐으로 생성성 극대화

라.    Machine learning & Deep Learning

     머신러닝은 인공지능 연구 분야 중 하나로, 인간의 학습 능력과 같은 기능을 컴퓨터에서 실행하고자 하는 기술 및 기법

     딥러닝은 컴퓨터가 많은 데이터를 이용해 사람처럼 스스로 학습할 수 있게 하기 위하여 인공신경망(ANN, Artificial Neural Network)등의 기술을 기반하여 구축한 기계 학습 기술 중 하나이다.

     딥러닝은 다층구조 형태의 신경망을 바탕으로 하는 머신 러닝의 한 분야이다.

     Deep learning은 대용량 데이터에서 의미있는 정보를 추출하여 의사결정에 활용하는 기술이다(X)

     데이터 마이닝(Data Mining)은 대용량 데이터에서 의미있는 정보를 추출하여 의사결정에 활용하는 기술이다

     딥러닝의 분석기법에는 ANN, CNN, RNN, LSTM, Autoencoder, SVM(X, 분류분석기법) 가 있다

     딥러닝 오픈소스에는 Caffe, Tensorflow, Theano, Anaconda(X) 가 있다.

4.     기타

가.    데이터양의 단위

단  위 데이터량
바이트(B)  
킬로바이트(KB)  
메가바이트(MB)  
기가바이트(GB)  
테라바이트(TB)  
페타바이트(PB)  
엑사바이트(EB)  
제타바이트(ZB)  
요타바이트(YB)  

나.    B2B B2C

     B2B: 기업과 기업사이의 거래 기반의 비즈니스 모델

     B2C: 기업과 고객사의 거래 기반 비즈니스 모델

다.    블럭체인

     거래정보를 하나의 덩어리로 보고 이를 차례로 연결한 거래 장부

     거래에 참여하는 모든 사용자에게 거래 내역을 보내주며 거래 때마다 이를 대조해 위조를 방지

라.    사물 인터넷 (IOT, Internet of Things)

     데이터화에 큰 영향을 미치는 기술이다.

     인터넷 기반으로 모든 사물을 연겨해 사람과 사물, 사물과 사물 간의 정보를 상호 소통하는 지능형 기술 및 서비스이며, 사물에서 생성되는 Data를 활용한 분석을 통해 마케팅 등에 활용할 수 있다.

     사람의 개입 없이 사물간 통신하는 기술

 

마.    데이터의 유형

5절   기타

1.     data cardinality? N : 1

반응형

+ Recent posts