AI 영상 업스케일링 프로그램 제작
1. 다시한번 도전
이전에 PyQt를 이용해서 만들어 보려고 했었던 것에 이어서 다시 도전하려고 한다.
잠시 대회를 참가하느랴 신경을 못 썼던것도 있고, 문제점들이 속속 나와서 다시 시도하려고 한다.
현재 시도하려는 부분은
1. Stable Diffusion 의 Web ui처럼 gui로 사용할 수 있을것.
2. 최대한 잘 모르는 사람이 써도 사용할 수 있을것
3. 복잡한 설치가 없을것.
4. 사용할 수 있을 정도의 속도.
한동안 PyQt 이외에도 아예 Qt Creator를 받아서 Pyside도 사용해봤지만,
desktop 프로그램의 배포부분에 있어서 Python은 최악이었다.
아무것도 없이 GUI만 세팅해서 빌드하면 4GB가 넘는데, 이건 말도 안된다고 생각한다.
아마 import만 해도 통째로 모든 라이브러리들을 집어넣는거같은데.. 어쨋든 못써먹는다.
Web ui식의 배포도 솔직히 좀 별로라고 생각한다.
일반인이 설치하는데 파이썬 설치에다가, 커맨드라인까지 쳐가며 설치하고 한다는게 좀..
그래서 가장 좋은 방법은 C++이고, 차선이 C#이다.
C++은 예전에 써봤었지만, low level 수준이었고 프레임워크 다루는 수준으로 하려면
다시 배워가면서 한다는건 좀 빠르게 하기가 힘들 것 같아서
C#으로 진행하기로했다.
2. 프로토타입의 완성
프로토타입을 제작해본 결과 일단 나쁘진 않은 것 같다.
그런데 아직 많이 문제가 발생하고 있어서 조금 더 수정해서 배포를 시작하려고 한다.
현재 가장 큰 문제는
.NET Framework로 제작했더니 FP16의 지원에서 뭔가 문제가 있는것 같다.
.NET이 어떤식으로 되어있는지 모른채로 깔려있는것으로 시작했는데, 알고보니 지원중단되었고
.NET으로 통합되었는듯.
해서 다시 .NET 7으로 재작성 및 FP16까지 테스트 해보고
프로토타입을 배포할 예정이다.
3. 이후 계획
현재 SwinIR 을 기준으로 완성되면 프로토 타입을 배포 할 예정이다.
Batch Inference에서의 출력 문제 및 bottle neck 발생의 문제도 해결해야 하는데, 좀 미뤄질 것 같다.
프로토타입이 배포된 이후에는 다른 모델들도 추가적으로 넣을 예정이다.
RealESRGan 이라던가, BSRGAN 등.
아무래도 리소스를 많이 먹고 시간이 걸리는 모델들이다 보니 최대한 이런것들을 개선하는 방향으로
진행하려고 한다.
'Learning and Running' 카테고리의 다른 글
.Net 에서 ONNX runtime TensorRT Option 설정하기 (0) | 2023.03.30 |
---|---|
AI 영상 업스케일링 프로그램 제작2 (0) | 2023.03.27 |
PyQT를 이용한 ESRGAN video 업스케일링 프로그램 제작2 (0) | 2023.02.08 |
PyQT를 이용한 ESRGAN video 업스케일링 프로그램 제작 (0) | 2023.01.30 |