목록AI (14)
isPowerfulBlog
우여곡절 많았던 StyleGAN2 TensorFlow 모델 코랩 환경에서의 세팅 정리... StyleGAN2 ADA TensorFlow 모델도 동일하게 환경 세팅해주면 된다. https://github.com/NVlabs/stylegan2-ada Requirements Python 3.6.9 Colab 환경이니까 Anaconda는 따로 X TensorFlow 1.15 is also supported on Linux NVIDIA drivers, CUDA 10.0 toolkit 이 정도로 준비하면 되겠다 Python Version Downgrade %python --version tensorflow 1.x version 사용을 위해 python 버전을 3.6.x로 다운그레이드해줘야함 !wget https:/..
공개된 모델을 사용할 때, TensorFlow나 PyTorch를 호환되는 버전으로 다운그레이드 해야할 때가 있다. Colab에서 default로 제공되는 TensorFlow는 2.x인데, TensorFlow 1.15로 다운그레이드 해보자 Python version downgrade 먼저TensorFlow 1.x 버전에 호환되는 버전으로 Python을 다운그레이드 해줘야한다. - !python --version 파이썬 버전확인 !wget https://www.python.org/ftp/python/3.6.9/Python-3.6.9.tgz !tar xvfz Python-3.6.9.tgz !Python-3.6.9/configure !make !sudo make install 파이썬 3.6x으로 파이썬 재설치 ..
StyleGAN을 이용한 프로젝트를 진행하면서, 어떤 특징을 특정하여 변환을 주고 싶은데 어떻게 특징을 추출해야 그게 가능할지에 대한 고민이 많았다. 찾아보니 PCA를 이용하여 특징을 추출해내는 방식에 대해서 발표한 논문이 있어 정리해보게 되었다. GANSpace PCA를 이용하여 인간의 개념으로 해석 가능한 latent direction을 찾아 해석 가능한 특징 컨트롤 방법을 제시 해석가능한 컨트롤이란 목적에 적절하게 선택 된 latent direction을 말함 Demo latent direction $$ I: z \sim p(z), \ I = G(z) $$ $I = G(z)$ 는 generator는 벡터 $z$를 input으로 하여 RGB 이미지 $I$를 생성하는 수식 ${z}$ 는 latent s..
OCR이란? Optical Character Recognition 광학 문자 인식 OCR pipeline OCR의 파이프라인은 위와 같고 간단히 요약하자면 Text Detection과 Recognition을 거쳐 이미지 속 글씨를 인식한다고 보면 된다. 앞으로 Detection과 Recognition에 집중해서 공부해봐야겠다. OCR 엔진 비교 많이 사용하는 듯한 OCR 두 개, easyocr과 tesseract EasyOCR https://github.com/JaidedAI/EasyOCR 영수증이나 PDF처럼 글자 구조가 잘 잡혀있는 이미지에 대해 성능이 좋음 GPU 지원 O Tesseract https://github.com/tesseract-ocr/tesseract 고해상도 이미지에서 성능이 좋음 ..
런타임 연결 끊김 방지 구글 코랩에서는 일정 시간 이상 동안 클릭 등의 활동이 없으면 런타임이 끊긴다. function ClickConnect(){ console.log("Working"); document.querySelector("colab-toolbar-button").click() } setInterval(ClickConnect, 1800000) 검사모드 키고 콘솔창에서 위 코드 실행 30분에 한 번 씩 셀이 추가되면서 연결 끊김을 방지
StyleGAN PGGAN 구조에서 Style transfer 개념을 적용한 새로운 generator architecture Style transfer 특정 이미지에서 style(나무)을 뽑아내고 다른 이미지에서 content(의자)를 뽑아내서 이를 합성(나무의자)하는 방식 PGGAN 학습을 진행하는 과정에서 점진적으로 layer를 추가해나가면서 점진적으로 해상도 증가시키는 generator architecture 의의 한 번에 고해상도 이미지를 만드는 것 보다 안정적으로 이미지 생성 가능 학습 속도가 많이 향상됨 한계 이미지의 특징 제어가 어려움 이러한 PGGAN의 한계를 극복하고자 StyleGAN에서는 image의 특징들을 disentangle시키는 구조로 특징 제어 성능을 향상시킴 Disentang..