AI/Computer vision3 LPIPS (Learned Perceptual Image Patch Similarity) 작동 원리와 코드 LPIPS란?LPIPS는 2018년 UC Berkeley 연구진이 개발한 딥러닝 기반의 이미지 유사도 측정 지표이다. 기존의 PSNR이나 SSIM과 같은 전통적인 메트릭들이 픽셀 단위의 차이를 측정하는 것과 달리, LPIPS는 인간의 시각적 인지와 유사한 방식으로 이미지간 차이를 평가한다.사실 LPIPS에 관하여 설명한 포스팅은 너무나 많은데, 정확하게 어떻게 작동되는지 설명하는 포스팅은 거의 보지 못하여 작동 원리를 기반으로 기록을 남기고자 한다. 참고로 LPIPS에 대한 기초 개념 이해는 아래 블로그에서 많은 도움을 받았다.https://xoft.tistory.com/4 [평가 지표] LPIPS : The Unreasonable Effectiveness of Deep Features as a Perc.. 2025. 9. 15. 이미지에서 Self-Attention이 필요한 이유와 동작 원리 (강아지 예제로 쉬운 설명) 이미지 Self-Attention 완벽 이해이 포스트에서는 이미지에서 Self-Attention이 왜 중요한지, 그리고 실제로 어떻게 동작하는지를 시각적인 예시(강아지 이미지)와 함께 직관적으로 설명합니다. Vision Transformer, 이미지 인식, 객체 탐지 등에 관심 있다면 꼭 이해해야 할 핵심 개념입니다.왜 이미지에서 Self-Attention이 필요한가?1. 픽셀 간 장기 의존성 모델링이미지의 한 픽셀은 멀리 떨어진 픽셀과도 관련될 수 있습니다. 예를 들어 강아지의 귀(왼쪽 위)와 꼬리(오른쪽 아래)는 떨어져 있지만 둘 다 같은 객체에 속합니다. Self-attention은 이런 관계를 효과적으로 학습합니다.2. CNN의 한계 보완CNN은 고정된 커널 크기로 주변 정보만 처리합니다. 반면 .. 2025. 7. 16. Computer Vision (컴퓨터 비전) 연구의 역사 A brief history of computer vision and deep learning 컴퓨터 비전 연구의 시작 Hubel and Wiesel, 1959 - 고양이 실험 고양이의 시각 피질 실험에서 고양이 시야의 한 쪽에 자극을 주었더니 전체 뉴련이 아닌 특정 뉴런만 활성화 물체의 형태와 방향에 따라서도 활성화되는 뉴런이 다름 → 시각 정보가 뇌에서 어떻게 처리되는지에 대한 이해 Larry Roberts, 1963 사진 정보를 컴퓨터로 가져오는 방법에 관한 연구 The Sight System을 통해 물체를 비교적 정확하게 인식 → 초기 컴퓨터 비전 분야에서 3차원 물체 인식을 위한 중요한 기반 제공 David Marr, 1970s Primitive Representations : 시각적 자극을 간.. 2023. 5. 16. 이전 1 다음