매우 간단하게 설명하면...
임의의 데이터를 정해진 룰에 맞게 필터링하는 것.
예를 들어 임의의 자연수 백만개를 어떤 필터에 넣었더니, 짝수인지 홀수인지 알았다.
이것이 HASH이다.
너무 간단하게 설명해서 좀 추가...
hash가 사용되는 곳은 이렇다.
연속되는 많은 데이터가 있다.
여기서, 연속된다는 의미는 1회, 2회등, 1.5회가 없는 데이터이다.
키의 경우. 170도 있고, 170.1도 있고.. 경우에 따라서는 170.15도 있을 있다.
그래프로 그릴 때 연속적인 데이터는 선으로 그려질 수 있고, 이산(비연속)적인 데이터는 막대그래프로 그려진다.
자! 다시! 연속되는 많은 데이터를 이산 데이터로 표현하고 싶다고 하자. 이럴 경우는 많다.
요즘 SPC를 공부하고 있어서 통계를 좀 보고 있는데, 히스토그램을 그린다고 치자. 계급을 나누어야 한다.
예로 들기에 키가 적당하다.
어떤 반에 키를 조사했더니, 165도 있고, 168도 있고, 170도 있고, 180 185등이 있을 것이다.
150~160, 160~170, 170~180, 180 이상
이렇게 등급을 나누었다면
155인 놈은 150~160사이에 들어갈테고, 158인 놈도 같은 값(150~160인 계급을 1계급 이라고 하면 1계급이라는 값이 된다.)에 들어갈 테고, 168인 놈은 160~170인 등급(뭐 2등급 정도 되겠지)에 들어 갈 것이다.
이렇게 한 반에 한 50명이라고 치자.(우리때는 50명 정도 했던거 같다. 요샌 30명 수준이래매)
그럼 50명이 4개의 계급에 들어가는 것이다.
데이터가 간결해 졌다. 이것으로 데이터를 2차 가공 할 수 있는 것이다.
이것이 hash이다.
더 구체적으로 잘 알게 되면 또 추가하겠음.
댓글 없음:
댓글 쓰기