Introduction to Explainable AI (2)


지난 포스팅에 이어 Explainable Artificial Intelligence: Understanding, Visualizing and Interpreting Deep Learning Models 논문에 소개된 XAI의 방법 중 SA과 LRP의 평가 방법과 실제 사례 부분에 대해 알아보겠습니다.


지난 포스팅을 간단하게 요약하자면 다음과 같습니다.

  • 설명가능한 AI(Explainable AI, XAI)
    • 기존 AI 기능에 결과에 대한 인과관계를 분석해서 적절한 근거 및 타당성을 찾아, AI의 행위와 판단을 사람이 이해할 수 있는 형태로 설명할 수 있는 기술
  • XAI에 필요한 특성 : 설명성(Explainability)
    • 해석성(Interpretability) : 시스템의 구조를 사람이 이해할 수 있도록 설명하는 것
    • 정확성(Completeness) : 시스템이 돌아가는 원리를 정확한 방법으로 설명하는 것

xai (출처 : 조현욱, “못 믿겠다 AI, 설계자도 심층신경망 작동 방식 몰라”, 중앙SUNDAY, 2018. 2. 25)

  • 대표적인 2가지 해석 기법 - Sensitivity Analysis(SA), Layer-Wise Relevance Propagation(LRP)

1) Sensitivity Analysis(SA) : 입력 변화에 대한 예측 결과의 변화량을 정량화하여 어떤 부분이 결과 도출에 큰 영향을 미쳤는지 설명하는 방법

2) Layer-Wise Relevance Propagation(LRP) : 딥러닝 모델에서 각 레이어별 기여도를 측정할 수 있는 방법이며, 수치로 확인할 수 있음


4. Evaluating the quality of explanations

딥러닝 모델을 설명하기 위해 SA, LRP와 같은 많은 방법들이 있습니다. 이러한 방법들이 모델을 얼마나 잘 설명하는지(ex. 히트맵) 비교하기 위해서는 설명의 품질(quality)에 대한 객관적인 측정이 필요합니다.

아래 이미지를 통해 Gradient, SmoothGrad 등과 같은 다양한 방법들의 결과와 입력값과 모델의 학습에 전혀 관계 없는 Edge Detector의 결과가 차이가 크지 않은 것을 볼 수 있습니다. 이러한 이유로 시각적인 요소로 모델을 평가 및 비교하는 것보다 객관적인 측정값의 필요함을 느낄 수 있습니다.

heatmap (출처 : Sanity checks for saliency maps)


본 논문에서는 섭동 이론(perturbation theory)에 기초한 품질 측정을 제안합니다.

  • ‘섭동 이론’이란 물리학 전반에서 정확한 해가 잘 알려진 어떤 계에 미세한 변화를 줬을 때 그 해가 어떻게 변화하는지를 수학적으로 풀어내기 위한 도구입니다.
  • 여기선 이해하기 쉽게 편의상 ‘perturbation = 미세변화’ 라고 하겠습니다.

해당 방법은 다음의 세 가지 아이디어를 기반으로 합니다.

  1. 예측에 매우 중요한 입력 변수의 perturbation은 덜 중요한 입력 변수들의 perturbation보다 크다.
    • perturbation of input variables which are highly important > the perturbation of input dimensions which are of lesser importance
    • 그렇기 때문에 중요한 입력 변수의 미세변화가 일어날수록 예측 점수가 더 급격하게 감소하게 됩니다.
  2. SA와 LRP와 같은 설명 방법은 모든 입력 변수에 점수를 제공합니다.
    • 따라서 제공된 관련성 점수에 따라 입력 변수를 정렬할 수 있습니다.
  3. 입력 변수를 가장 관련성이 높은 변수부터 시작하여 반복적으로 변화시켜, 모든 변화 단계 후에 예측 점수를 확인할 수 있습니다.
    • 예측 점수(정확도)가 감소가 크게 감소하는 것은 관련성이 높은 입력 변수를 식별하였음을 의미합니다.

이를 간단히 요약하자면, (1) SA와 LRP와 같은 설명 방법의 점수를 계산하고 (2) 상위 k번째 입력 변수를 선택하여 (3) random noise를 주고 예측 점수를 확인한 뒤 (4) 이를 통해 관련성이 높은 변수를 찾고 예측 점수의 변화폭을 확인하는 것입니다.


5. Experimental evaluation

위에서 설명한 내용을 바탕으로, 세 가지 다른 문제(이미지 주석, 텍스트 문서 분류, 비디오에서의 사람 행동 인식)를 통해 SA과 LRP 방법을 평가한 내용을 설명합니다.

1. Image classification

이미지 분류에 대한 설명 가능한 방법의 적용에 대한 예시입니다. (관련 논문)

  • Explaining predictions : “Volcano”, “Coffee Cup” (화산, 커피) coffee

GoogleNet 모델을 사용하여 ILSVRC2012 데이터셋으로 물체를 분류하였으며, 위의 왼쪽 사진은 데이터 셋 중 VolcanoCoffee Cup으로 올바르게 분류된 두 개의 이미지입니다. 우측의 4개의 히트맵은 SA와 LRP를 통해 시각화한 것입니다.

  • SA 히트맵 : LRP에 비해 노이즈가 많으며 해석하기 어려움
  • LRP 히트맵 : 커피의 경우 컵의 타원체 모양으로 커피와 관련된 특징임을 잡아내고, 산의 경우 산의 솟은 형태로 화산과 관련된 특징을 잡아낸 것을 보여줌

이를 통해 LRP와 달리 SA는 각 픽셀이 예측에 얼마나 기여하는지를 나타내지 않고 입력 변화에 대한 모델의 민감도를 측정하기 때문에, LRP가 SA보다 모델의 예측에 대해 더 나은 설명을 제공한다고 할 수 있습니다.

coffee - 복사본

위의 그림은 perturbation 분석 결과를 그래프로 표현한 것입니다. y축은 ILSVRC2012 데이터 셋의 5,040개 이미지에 대한 예측 점수 평균의 상대적 감소를 나타냅니다. 예를 들어 0.8은 원래 점수가 평균 20% 감소했음을 의미합니다.

  • SA heatmap < LRP heatmap : LRP가 SA보다 더욱 점수가 급격하게 줄어든 점을 볼 수 있으며, 그만큼 특정을 더 잘 추출한 것을 알 수 있음


2. Text document classification

텍스트 문서 분류에 대한 설명 가능한 방법의 적용에 대한 예시입니다. (관련 논문)

  • Explaining prediction : “sci.med” (의학 관련 글) text

단어 임베딩(word-embedding) CNN 모델을 사용하여 20Newsgroup 데이터셋으로 텍스트 문서를 분류하였으며, 위의 텍스트 문서는 sci.med 항목으로 의료과 관련된 글입니다. SA와 LRP를 통해 시각화한 히트맵은 위의 그림과 같으며, 관련성 점수 $R_i$가 모든 단어에 할당되어 표시된 것을 확인할 수 있습니다.
SA와 LRP 모두 body, discomfort, sickness 등과 같은 단어가 분류를 결정하는데 있어 중요하다고 판단하였습니다.

  • SA 히트맵 : 의학과 관련된 단어를 빨간색으로 표현하였으며, LRP와 달리 해당 주제와 다른 범주에 포함되는 단어를 구별하지 못함
  • LRP 히트맵 : SA과 달리 의학과 관련된 단어를 빨간색, 의학과 관련되지 않은 단어를 파란색으로 표현하였음. 이를 통해 주제와 다른 범주를 구별할 수 있다는 것을 알 수 있음

text - 복사본

위의 그림은 분류에 대한 정확도를 그래프로 표현한 것입니다. y축은 20Newsgroup 데이터 셋의 4,154개 텍스트에 대한 예측 정확도의 상대적 감소를 나타냅니다. 즉, 모든 perturbation 단계에서 해당 입력 값을 0으로 설정하여 SA와 LRP 점수에 따른 가장 중요한 단어를 순차적으로 삭제하며 정확도에 대한 변화를 의미합니다.

  • LRP가 SA보다 더욱 주제에 맞는 단어를 잘 잡아내고, 이러한 단어를 삭제함에 따라 예측 정확도가 더 빨리 낮아진다는 것을 확인할 수 있음


3. Human action recognition in videos

동작 벡터 특징(motion vector features)에 기초한 인간 행동 인식 분류에 대한 설명 가능한 방법의 적용에 대한 예시입니다. (관련 논문)

  • Explaining prediction : “sit-up” exercise

SVM 모델을 사용하여 HMDB51 데이터셋으로 사람의 행동을 분류하였으며, 위의 사진은 sit-up 행동으로 올바르게 분류된 비디오 샘플의 5개의 프레임(frame)에 표시된 LRP의 히트맵입니다. 아래의 그래프는 5개의 프레임에 따른 LRP 관련성 분포에 대한 것입니다.

  • LRP 히트맵 : 사람이 상하로 움직이는 동작을 수행할 때 주로 사람의 상체를 둘러싼 블록이 중요하다고 표시하고 있음을 알 수 있음
  • LRP 관련성 분포 : 히트맵과 같이 상하로 움직일 때 관련성 점수가 더 높다는 것을 확인할 수 있음 따라서 LRP 히트맵과 관련성 분포을 통해 비디오의 프레임 내에서 관련 동작이 발생한 위치를 시각화하며, 관련 동장이 발생하는 시점을 파악할 수 있습니다.


6. Conclusion

블랙박스 모델이 특정 분야(ex. 의료 영역)에 허용되지 않는 이유로 인해 나오게 된 AI의 설명 가능성(XAI) 방법에 대해서 알아보았습니다. 설명 가능성(explainability)은 모델의 결함과 데이터의 편향을 감지하고, 예측을 검증하고, 모델을 개선하며, 최종적으로 문제에 대한 새로운 통찰력을 얻을 수 있는 강력한 도구입니다. SA와 LRP와 같은 대표적인 2가지 설명 방법을 소개하고, 세 가지 문제(이미지, 텍스트 문서, 영상)에 적용한 결과를 통해 SA와 LRP 방법을 평가한 내용을 설명합니다. 세 가지 예시에서 모두 LRP가 SA보다 모델의 예측에 대해 더 나은 설명을 제공함을 확인할 수 있습니다.


Reference


🔜 Next

제가 주로 맡았던 분석 프로젝트는 대부분 통계적 방법론이나 머신러닝 등에 대한 이해도가 낮은 현업들의 문제 해결을 위한 의뢰로 진행되는 경우가 많았습니다. 그리하여 분석 결과에 대한 직관적인 설명과 이를 시각적으로 표현해야 하는 것이 필수적이라 생각하여, 분석 결과를 어떤 방식으로 잘 전달할 수 있을지 많이 고민했었던 기억이 납니다. 물론 지금 진행하고 있는 프로젝트에서도 마찬가지이구요!
XAI에 대한 관심은 작년부터 딥러닝에 대해 공부하면서 작동하는 원리와 그 결과에 대한 원인을 시각적으로 보고 싶다는 생각으로 시작된 것 같습니다. 만약 양품과 불량품에 대한 이미지 분류를 진행할 때 현업에게 예측 결과를 설명해야하는 경우, 어떻게 쉽게 설명이 가능하게끔 방향을 잡아야할지에 대한 고민이 먼저 생기더라구요. 관련 내용 공부를 조금씩 시작하고 있어서, 그러한 기념(?)으로 Explainable AI(설명 가능한 인공지능)를 소개하는 글을 쓰게 되었습니다.
또한 해당 XAI 논문에 대해 포스팅을 하는 동안, XAI 설명 가능한 인공지능, 인공지능을 해부하다 책이 집에 도착했습니다!!🤗 다음 포스팅은 책을 다 읽고 중요 내용을 간략하게 정리하며 책 리뷰를 하려고 합니다.

긴 글 읽어주셔서 감사합니다. 조금 덕후 같지만 오늘 하루도 장수와 번영하시길 바랍니다(Live Long and Prosper) 🖖




© 2020.02. by ysjang0926

Powered by theorydb