공부/빅데이터분석기사

[빅데이터분석기사] 빅데이터 개요 및 활용, 데이터

Blackshoot 2021. 8. 11. 22:43
반응형

 

1. 데이터 정의

  • 데이터는 추론과 추정의 근거를 이루는 사실이다.
  • 현실 세계에서 관찰하거나 측정하여 수집한 사실다.

2. 데이터 특징

  • 단순한 객체로도 가치가 있으며 다른 객체와의 상호관계 속에서 더 큰 가치를 갖는다.
  • 객관적 사실이라는 존재적 특성을 갖는다.
  • 추론, 추정, 예측, 전망을 위한 근거로써 당위적 특성을 갖는다.

3. 데이터 구분

  • 정량적 데이터: 주로 숫자로 이루어진 데이터이다.
  • 정성적 데이터: 문자와 같은 텍스트로 구성되며 함축적 의미를 지니고 있는 데이터이다.
  정량적 데이터 정성적 데이터
유형 정형 데이터, 반정형 데이터 비정형 데이터
특징 여러 요소의 결합으로 의미 부여 객체 하나가 함축된 의미 내포
관점 주로 객관적 내용 주로 주관적 내용
구성 수치나 기호 등 문자나 언어 등
형태 데이터베이스, 스프레드시트 등 웹 로그, 텍스트 파일 등
위치 DBMS, 로컬 시스템 등 내부 웹사이트, 모바일 플랫폼 등 외부
분석 통계 분석시 용이 통계 분석시 어려움

4.데이터 유형

  • 정형 데이터: 정해진 형식과 구조에 맞게 저장되도록 구성된 데이터이며, 연산이 가능하다.
  • 반정형 데이터: 데이터의 형식과 구조가 비교적 유연하고, 스키마 정보를 데이터와 함께 제공하는 파일 형식의 데이터이며, 연산이 불가능하다.
  • 비정형 데이터: 구조가 정해지지 않은 대부분의 데이터이며, 연산이 불가능하다.

5.데이터의 근원에 따른 분류

  가역 데이터 불가역 데이터
환원성(추적성) 가능(비가공 데이터) 불가능(가공 데이터)
의존성 원본 데이터 그 자체 원본 데이터와 독립된 새 객체
원본과의 관계 1대1의 관계 1대N, N대1 OR M대N의 관계
처리과정 탐색 결합
활용분야 데이터 마트, 데이터 웨어하우스 데이터 전처리, 프로파일 구성

6. 데이터 기능

  • 암묵지: 어떠한 시행착오나 다양하고 오랜 경험을 통해 개인에게 체계화되어 있으며, 외부에 표출되지 않은 무형의 지식으로 그 전달과 공유가 어렵다.
  • 형식지: 형상화된 유형의 지식으로 그 전달과 공유가 쉽다.

7.지식창조 매커니즘

  • 공통화: 서로의 경험이나 인식을 공유하며 한 차원 높은 암묵지로 발전시킨다.
  • 표출화: 암묵지가 구체화되어 외부(형식지)로 표현된다.
  • 연결화: 형식지를 재분류하여 체계화한다.
  • 내면화: 전달받은 형식지를 다시 개인의 것으로 만든다.

8.데이터, 정보, 지식, 지혜

지혜 축적된 지식을 통해 근본적인 원리를 이해하고 아이디어를 결합하여 도출한 창의적인 산물
지식 상호 연결된 정보를 구조화 하여 유의미한 정보를 분류하고 개인적인 경험을 결합시켜 내재화한 고유의 결과물
정보 데이터를 가공, 처리하여 데이터간 관계를 분석하고 그 속에서 도출된 의미를 말하며, 항상 유용한 것은 아니다
데이터 현실 세계에서 관찰하거나 측정하여 수집한 사실이나 값으로 개별 데이터로는  의미가 중요하지 않은 객관적인 사실

 

반응형