2010년 5월 18일 화요일

HASHING

매우 간단하게 설명하면...
임의의 데이터를 정해진 룰에 맞게 필터링하는 것.
예를 들어 임의의 자연수 백만개를 어떤 필터에 넣었더니, 짝수인지 홀수인지 알았다.
이것이 HASH이다.

너무 간단하게 설명해서 좀 추가...

hash가 사용되는 곳은 이렇다.
연속되는 많은 데이터가 있다.
여기서, 연속된다는 의미는 1회, 2회등, 1.5회가 없는 데이터이다.
키의 경우. 170도 있고, 170.1도 있고.. 경우에 따라서는 170.15도 있을 있다.
그래프로 그릴 때 연속적인 데이터는 선으로 그려질 수 있고, 이산(비연속)적인 데이터는 막대그래프로 그려진다.

자! 다시! 연속되는 많은 데이터를 이산 데이터로 표현하고 싶다고 하자. 이럴 경우는 많다.
요즘 SPC를 공부하고 있어서 통계를 좀 보고 있는데, 히스토그램을 그린다고 치자. 계급을 나누어야 한다.

예로 들기에 키가 적당하다.
어떤 반에 키를 조사했더니, 165도 있고, 168도 있고, 170도 있고, 180 185등이 있을 것이다.

150~160, 160~170, 170~180, 180 이상
이렇게 등급을 나누었다면

155인 놈은 150~160사이에 들어갈테고, 158인 놈도 같은 값(150~160인 계급을 1계급 이라고 하면 1계급이라는 값이 된다.)에 들어갈 테고, 168인 놈은 160~170인 등급(뭐 2등급 정도 되겠지)에 들어 갈 것이다.

이렇게 한 반에 한 50명이라고 치자.(우리때는 50명 정도 했던거 같다. 요샌 30명 수준이래매)

그럼 50명이 4개의 계급에 들어가는 것이다.
데이터가 간결해 졌다. 이것으로 데이터를 2차 가공 할 수 있는 것이다.

이것이 hash이다.

더 구체적으로 잘 알게 되면 또 추가하겠음.

댓글 없음:

댓글 쓰기