Maxima's Lab

[Python, Tensorflow] Mean, SparseCategoricalAccuracy (tensorflow.keras.metrics) 본문

Python/Tensorflow

[Python, Tensorflow] Mean, SparseCategoricalAccuracy (tensorflow.keras.metrics)

Minima 2022. 8. 6. 20:56
728x90
SMALL

안녕하세요, 오늘은 Tensorflow 내 tensorflow.keras.metrics 함수들에 대해서 알아보겠습니다.

 

tensorflow.keras.metrics 내 사용해볼 함수들은 다음과 같습니다.

 

  • Mean() : 주어진 값들에 대해 평균값을 계산하며, 주로 update_state, reset_state, result 함수를 호출
  • SparseCategoricalAccuracy() : 정수값과 대응되는 Logit의 argmax값의 정확도를 계산하며, 유사하게 update_state, reset_state, result 함수를 호출

먼저, Mean() 함수에 대해서 알아보겠습니다.

import tensorflow as tf

mean = tf.keras.metrics.Mean()
print(mean.result().numpy())
0.0

위의 코드와 같이, tf.keras.metrics.Mean() 함수를 호출하여 초기값을 result().numpy() 함수를 통해 확인하면 0.0 이 나오는 것을 확인할 수 있습니다.

 

다음은, 초기화된 변수에 [1, 2, 3, 4, 5] --> 5개의 값들을 업데이트 한 결과입니다.

import tensorflow as tf

mean = tf.keras.metrics.Mean()
mean.update_state([1, 2, 3, 4, 5])
print(mean.result().numpy())
3.0

위의 코드 기준으로, [1, 2, 3, 4, 5]의 값들이 업데이트(update_state) 된 상태에서 추가적으로 [-1, -2, -3, -4, -5]의 값들을 추가적으로 업데이트 하면 기존에 있었던 값들에 쌓이게 되어 [(1 + 2 + 3 + 4 + 5) + (-1 -2 -3 -4 -5) ] / 10 = 0.0의 값으로 반환되게 됩니다.

 

import tensorflow as tf

mean = tf.keras.metrics.Mean()
mean.update_state([1, 2, 3, 4, 5])
print(mean.result().numpy())

mean.update_state([-1, -2, -3, -4, -5])
print(mean.result().numpy())
3.0
0.0

 

다음은, reset_state 함수를 사용해서 처음의 초기값이 었던 0.0으로 설정 후 추가적으로 업데이트 한 결과입니다.

 

import tensorflow as tf

mean = tf.keras.metrics.Mean()
mean.update_state([1, 2, 3, 4, 5])
print(mean.result().numpy())

mean.reset_state()
print(mean.result().numpy())

mean.update_state([-1, -2, -3, -4, -5])
print(mean.result().numpy())
3.0
0.0
-3.0

위의 코드 내 reset_state 함수를 사용하지 않았다면, 최종 mean.result().numpy() 결과가 0.0으로 반환되지만 중간에 0.0으로 초기화 되었기 때문에 최종 결과가 -3.0으로 반환되는 것을 확인할 수 있습니다.

 


이어서, SparseCategoricalAccuracy() 함수에 대해서 알아보겠습니다.

 

import tensorflow as tf

accuracy = tf.keras.metrics.SparseCategoricalAccuracy()
print(accuracy.result().numpy())
0.0

Mean 함수과 동일하게 값들을 업데이트 하지 않는 초기값은 0.0으로 설정됩니다.

 

import tensorflow as tf

accuracy = tf.keras.metrics.SparseCategoricalAccuracy()
accuracy.update_state([[0], [1], [1], [2]], 
                      [[0.1, 0.5, 0.3, 0.1], [0.1, 0.8, 0.05, 0.05], [0.3, 0.5, 0.1, 0.1], [0.05, 0.1, 0.8, 0.05]])

print(accuracy.result().numpy())
0.75

위의 코드에 대해서 살펴보도록 하겠습니다.

 

  • [[0], [1], [1], [2]] : 총 4개의 데이터 수로 구성되어 있고, 각 데이터의 Integer(정수형) Label 값들이 각각 0, 1, 1, 2
  • [[0.1, 0.5, 0.3, 0.1], [0.1, 0.8, 0.05, 0.05], [0.3, 0.5, 0.1, 0.1], [0.05, 0.1, 0.8, 0.05]]
    : 총 4개의 데이터에 각각 대응이 되며, softmax 함수의 결과 처럼 보이지만 실제로 SparseCateogoricalAccuracy 함수를 사용하기 위해서 0.1 + 0.5 + 0.3 + 0.1 = 1.0와 같이 반드시 1.0이 될 필요는 없습니다. 여기에서 중요한 점은 [0.1, 0.5, 0.3, 0.1] 내에서 최대값의 인덱스(argmax)가 1이기 때문에 대응되는 [0]과 비교했을 때 1과 0이 같지 않기 때문에 False 한 경우로 계산되게 됩니다.

위의 코드 내 [0.1, 0.5, 0.3, 0.1] --> [0.6, 0.5, 0.3, 0.1]로 수정한 결과는 다음과 같습니다.

 

import tensorflow as tf

accuracy = tf.keras.metrics.SparseCategoricalAccuracy()
accuracy.update_state([[0], [1], [1], [2]], 
                      [[0.6, 0.5, 0.3, 0.1], [0.1, 0.8, 0.05, 0.05], [0.3, 0.5, 0.1, 0.1], [0.05, 0.1, 0.8, 0.05]])

print(accuracy.result().numpy())
1.0

 

0.6 + 0.5 + 0.3 + 0.1의 값이 1.0이 아니지만, argmax 값을 [0]과 대응시켜 동일 여부를 확인하는 것이기 때문에 총 4개의 데이터에 대해서 True 한 경우로 계산된 것을 확인할 수 있습니다.

 

 

지금까지, Tensorflow 내 tensorflow.keras.metrics 내 함수들 중 Mean(), SparseCategoricalAccuracy()에 대해서 알아보았습니다.

728x90
LIST
Comments