일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | |||||
3 | 4 | 5 | 6 | 7 | 8 | 9 |
10 | 11 | 12 | 13 | 14 | 15 | 16 |
17 | 18 | 19 | 20 | 21 | 22 | 23 |
24 | 25 | 26 | 27 | 28 | 29 | 30 |
- 그래픽 유저 인터페이스
- vue.js
- pytorch
- 딥러닝
- 데이터베이스
- paper review
- numpy
- yaml
- FLASK
- GUI
- POD
- 파이토치
- OpenCV
- 텐서플로우
- 논문 리뷰
- tensorflow
- Web Programming
- kubernetes
- 컴퓨터 비전
- Django
- k8s
- Computer Vision
- Docker
- 파이썬
- Python
- MariaDB
- Tkinter
- 웹 프로그래밍
- 장고
- Deep Learning
- Today
- Total
Maxima's Lab
[Python, Tensorflow] Mean, SparseCategoricalAccuracy (tensorflow.keras.metrics) 본문
[Python, Tensorflow] Mean, SparseCategoricalAccuracy (tensorflow.keras.metrics)
Minima 2022. 8. 6. 20:56안녕하세요, 오늘은 Tensorflow 내 tensorflow.keras.metrics 함수들에 대해서 알아보겠습니다.
tensorflow.keras.metrics 내 사용해볼 함수들은 다음과 같습니다.
- Mean() : 주어진 값들에 대해 평균값을 계산하며, 주로 update_state, reset_state, result 함수를 호출
- SparseCategoricalAccuracy() : 정수값과 대응되는 Logit의 argmax값의 정확도를 계산하며, 유사하게 update_state, reset_state, result 함수를 호출
먼저, Mean() 함수에 대해서 알아보겠습니다.
import tensorflow as tf
mean = tf.keras.metrics.Mean()
print(mean.result().numpy())
0.0
위의 코드와 같이, tf.keras.metrics.Mean() 함수를 호출하여 초기값을 result().numpy() 함수를 통해 확인하면 0.0 이 나오는 것을 확인할 수 있습니다.
다음은, 초기화된 변수에 [1, 2, 3, 4, 5] --> 5개의 값들을 업데이트 한 결과입니다.
import tensorflow as tf
mean = tf.keras.metrics.Mean()
mean.update_state([1, 2, 3, 4, 5])
print(mean.result().numpy())
3.0
위의 코드 기준으로, [1, 2, 3, 4, 5]의 값들이 업데이트(update_state) 된 상태에서 추가적으로 [-1, -2, -3, -4, -5]의 값들을 추가적으로 업데이트 하면 기존에 있었던 값들에 쌓이게 되어 [(1 + 2 + 3 + 4 + 5) + (-1 -2 -3 -4 -5) ] / 10 = 0.0의 값으로 반환되게 됩니다.
import tensorflow as tf
mean = tf.keras.metrics.Mean()
mean.update_state([1, 2, 3, 4, 5])
print(mean.result().numpy())
mean.update_state([-1, -2, -3, -4, -5])
print(mean.result().numpy())
3.0
0.0
다음은, reset_state 함수를 사용해서 처음의 초기값이 었던 0.0으로 설정 후 추가적으로 업데이트 한 결과입니다.
import tensorflow as tf
mean = tf.keras.metrics.Mean()
mean.update_state([1, 2, 3, 4, 5])
print(mean.result().numpy())
mean.reset_state()
print(mean.result().numpy())
mean.update_state([-1, -2, -3, -4, -5])
print(mean.result().numpy())
3.0
0.0
-3.0
위의 코드 내 reset_state 함수를 사용하지 않았다면, 최종 mean.result().numpy() 결과가 0.0으로 반환되지만 중간에 0.0으로 초기화 되었기 때문에 최종 결과가 -3.0으로 반환되는 것을 확인할 수 있습니다.
이어서, SparseCategoricalAccuracy() 함수에 대해서 알아보겠습니다.
import tensorflow as tf
accuracy = tf.keras.metrics.SparseCategoricalAccuracy()
print(accuracy.result().numpy())
0.0
Mean 함수과 동일하게 값들을 업데이트 하지 않는 초기값은 0.0으로 설정됩니다.
import tensorflow as tf
accuracy = tf.keras.metrics.SparseCategoricalAccuracy()
accuracy.update_state([[0], [1], [1], [2]],
[[0.1, 0.5, 0.3, 0.1], [0.1, 0.8, 0.05, 0.05], [0.3, 0.5, 0.1, 0.1], [0.05, 0.1, 0.8, 0.05]])
print(accuracy.result().numpy())
0.75
위의 코드에 대해서 살펴보도록 하겠습니다.
- [[0], [1], [1], [2]] : 총 4개의 데이터 수로 구성되어 있고, 각 데이터의 Integer(정수형) Label 값들이 각각 0, 1, 1, 2
- [[0.1, 0.5, 0.3, 0.1], [0.1, 0.8, 0.05, 0.05], [0.3, 0.5, 0.1, 0.1], [0.05, 0.1, 0.8, 0.05]]
: 총 4개의 데이터에 각각 대응이 되며, softmax 함수의 결과 처럼 보이지만 실제로 SparseCateogoricalAccuracy 함수를 사용하기 위해서 0.1 + 0.5 + 0.3 + 0.1 = 1.0와 같이 반드시 1.0이 될 필요는 없습니다. 여기에서 중요한 점은 [0.1, 0.5, 0.3, 0.1] 내에서 최대값의 인덱스(argmax)가 1이기 때문에 대응되는 [0]과 비교했을 때 1과 0이 같지 않기 때문에 False 한 경우로 계산되게 됩니다.
위의 코드 내 [0.1, 0.5, 0.3, 0.1] --> [0.6, 0.5, 0.3, 0.1]로 수정한 결과는 다음과 같습니다.
import tensorflow as tf
accuracy = tf.keras.metrics.SparseCategoricalAccuracy()
accuracy.update_state([[0], [1], [1], [2]],
[[0.6, 0.5, 0.3, 0.1], [0.1, 0.8, 0.05, 0.05], [0.3, 0.5, 0.1, 0.1], [0.05, 0.1, 0.8, 0.05]])
print(accuracy.result().numpy())
1.0
0.6 + 0.5 + 0.3 + 0.1의 값이 1.0이 아니지만, argmax 값을 [0]과 대응시켜 동일 여부를 확인하는 것이기 때문에 총 4개의 데이터에 대해서 True 한 경우로 계산된 것을 확인할 수 있습니다.
지금까지, Tensorflow 내 tensorflow.keras.metrics 내 함수들 중 Mean(), SparseCategoricalAccuracy()에 대해서 알아보았습니다.