오늘은 로그차트와 일반차트의 차이에 대해 알아보려 한다.
아래 포스팅에 포함된 이미지 중 일부가 바로 로그차트, 혹은 물결차트(물결무늬차트)라고 한다.
22년도 아파트 거래량 및 거래량 회복 시작 신호?
올해 부동산시장은 침체와 하락 그 자체였다. 10%씩 빠진 단지는 명함도 못 내밀고, 고가 대비 2~30%씩 빠진 단지들도 수두룩하다. 때문에 매매 거래량은 최저, 하락폭은 최대로 기록될 것이라는
million-money.tistory.com
로그차트란 (물결차트)?
로그차트(log chart) : 로그 척도를 이용하여 차트를 표현한 것을 말하며, (절대) 값이 아닌, 값의 변화율을 나타내기 위해 사용한다.
아래와 같이 특정 값이 튀는 데이터를 보기 좋게 표현한 차트, 즉 세로축을 로그 스케일로 표현한 차트를 로그차트라 부른다.
(가장 좌측 빨간 막대에 물결 생략 무늬가 보일 것이다. 통상적으로 사용하는 이러한 무늬 때문에 물결차트 혹은 물결무늬차트라고도 불린다)
위에 나타낸 2개의 차트는 동일한 값을 나타내고 있지만 자세히 보면 세로축(Y축)의 간격이 다른 것을 알 수 있다.
우측의 일반적인 차트를 먼저 보면, 가장 좌측에 나타내져 있는 튀는 값 때문에 나머지 값들을 시각적으로 비교하기 어려운 것을 알 수 있다. 그리고 이럴때 사용하는 것이 바로 좌측의 로그차트다.
(굳이 읽고 이해할 필요는 없다 - 1)
좌측 차트의 세로축을 보면 낮은 값의 간격이 높은 값의 간격보다 더 넓은 것을 알 수 있다. 이러한 로그차트의 특성 때문에 특정 튀는 값이 있는 경우에도 시각적으로 잘 표현되는 것이다.
이유는 아래 테이블과 설명을 참고하자.
위 테이블을 보면, x는 값의 증가에 따라 똑같이 50씩 차이(dif)나는 반면에, log(x)는 점차 차이(dif(log))가 작아지는 것을 볼 수 있다.
이를 풀어말하면 높은 값(x)에서의 세로 축의 간격이 낮은 값(x)에서의 세로 축의 간격보다 좁다(차이가 작다)는 것을 의미한다.
즉, 로그차트에서는 낮은 값들의 간격은 넓어서(Y축 간격이 넓어서) 잘 보이고, 튀는 값(높은 값)에서의 간격은 상대적으로 좁기 때문에(Y축 간격이 좁아서) '이미지 1'에서와 같은 로그차트와 일반차트의 차이가 나타나는 것이다.
로그차트(물결차트) 사용법
위에서 설명한 특성을 이용하기 위하여 로그차트를 사용하고 싶다면, 엑셀 혹은 구글 스프레드시트에서 축 서식을 변경하면 된다. 차트 축 서식에서 '로그 눈금 간격'(엑셀) 혹은 '로가디즘 스케일'(구글 스프레드시트)을 체크하면 된다.
(로그(log)는 로가리듬(logarithm)의 줄임말이다)
로그차트로 설정 후, Y축 값을 삭제해서 이미지에 집중할 수 있게 하고(+ 혹여나 Y축 스케일에 대한 불필요한 질문 방지), 물결 표시 이미지를 중간에 삽입하여서 값 차이가 많이 나는 것을 시각화해주곤 한다. 아래 순서를 참고하자
※ 로그차트 만들기
① 일반차트
② 로그차트로 변환
③ 세로축(Y축) 없애기 (단, 세로축이 없기 때문에 아래와 같이 데이터라벨은 표시해 주는 것이 좋다)
④ 물결 이미지 삽입
로그차트를 사용하는 이유
일반적으로 로그차트를 사용하는 이유는 위와 같이 특정값이 튀어서 시각적으로 판단 하기 힘들 때 이를 보기 좋게 하는 것만으로 그 목적을 다할 것이다.
다만 서두에서 이야기하였듯 로그차트를 사용하는 추가적인 이유는 값의 변화율을 눈으로 확인하기 위해서이다.
(굳이 읽고 이해할 필요는 없다 - 2)
그럼 왜 로그 차트를 이용하면 변화율을 볼 수 있다고 하는 것일까?
(특히 주식하는 분들이 수익률를 보기 위해 로그차트를 많이 이용한다)
(로그차트 이해 - 2, 3 이미지 참조)
data : data를 보면 일정한 비율(50%)로 증가하는 것을 알 수 있다. ← 파란 실선, 50%씩 증가
dif : data의 차이는 5000, 7500, 11250과 같이 점차 증가하고 있다. ← 노란 실선, 점차 증가
dif(%) : data는 50%씩 일정하게 증가하고 있다. ← 빨간 막대그래프, 50%로 일정
data (log) : data가 증가함에 따라 증가. (표 참조)
dif(log) : data (log)의 차이를 보면 모두 동일한 값(0.17609)으로 증가하는 것을 볼 수 있다. (표 참조)
즉 data의 변화율이 일정하다면, data(log) 값의 차이가 일정하다는 것을 경험적으로 알 수 있게 되었다.
이를 풀어서 말하면 data x의 변화율이 log(x)에서의 Y축으로 표현된다는 것이다.
이는 x값의 변화율을 시각적으로 확인할 수 있다는 것을 말한다. (dif란 값의 차이로, Y축을 나타냄)
위에서는 경험적으로 알게 된 것이고, 아래 식을 통해 다시 한번 이해해 보자.
아래와 같이 (변화율)% 씩 일정하게 증가하는 x가 있다.
x1 = A
x2 = A x 변화율
x3 = (A x 변화율) x 변화율
그러면 log(x)는 아래와 같다
log(x1) = log(A)
log(x2) = log(A x 변화율)
log(x3) = log((A x 변화율) x 변화율)
여기서 log(x2) = log (A x 변화율) = logA + log(변화율) 이므로, ----------- (맨 아래 수학 개념 참고)
Y축의 간격이 log(변화율)이 되는 것이다.
log(x1) = logA
log(x2) = logA + log(변화율)
log(x3) = logA + log(변화율) + log(변화율)
즉, 일반 차트(x)를 로그 차트(log(x))로 변형시키면
값(x)의 변화율이 로그 차트에서의 Y축에서 나타난다는 의미이다.
다시말해, 일반 차트를 로그차트로 변형시키면, 값(X)의 변화율을 Y축을 통해 시각적으로 확인할 수 있는 것.
이것이 주식하는 분들이 종목 검토를 할 때, 일반차트와 함께 로그차트도 함께 보는 이유이다.
※ 수학 개념 참고 ※
log a + log b = log(a*b)
why?
X = logM ↔ 10^X = M
Y = logN ↔ 10^Y = N
M * N = 10^X * 10^Y = 10^(X + Y) => X + Y = log(M * N)
여기서 X + Y = logM + logN 이므로 logM + logN = log(M * N) 이 되는 것을 알 수 있다.
'etc' 카테고리의 다른 글
GDPR 설정 (0) | 2023.07.27 |
---|---|
난방비 폭탄 이유와 취약한 난방 방식 (난방비 추가 인상 여부) (0) | 2023.01.27 |
티스토리 블로그 성장기 (0) | 2021.11.12 |
댓글