Wednesday, December 27, 2023

openai whisper 연구기록

 12.27



구글 코랩으로 whisper 를 실행했다. 

성공했다.

주의할점은 

1. openai api 를 이용하기 위해 여러 패키지가 필요한데 pip 로 자동으로 설치하면 디펜던시 오류가 난다.

오류 메시지에 나타난 버전을 확인하고 매치되지 않는 패키지를 지우고 해당 버전의 패키지를 설치하면 문제없다.


cohere

openai

의 패키지를 pip 로 설치했다.


2. 쿠다코어 gpu를 이용하기 위해 pytorch가 필요한데 최신버전은 오류가 났다.

오류메시지를 확인하고 기존버전 삭제후 / 다음과 같은 버전의 패키지를 재설치하였다.

pip install torch==2.1.0 

pip install torchvision==0.16.0 

pip install torchaudio==2.1.0


3. 코랩에서 실시한 명령어는 다음과 같다.

!whisper voice_file.mp3 --model large --language ko --device cuda


4. 30분 짜리 음성이

small 모델이 2분

large 모델이 22분 만에 완료되었다. (오래된 컴퓨터 cpu 8시간 30분)


5. 코랩상태는 불안정하다.

조금만 안쓴다 싶으면 파일이 자동 삭제된다. 

엄청난 램과 gpu를 공짜로 쓰는 것에 비하면 감수할만하다. 

유료구독도 고려해봐야한다.


6. 해야할 것

결과물에 엉뚱한 외국어가 삽입된다. 특정언어로만 인식하는 명령어가 있을 것이다. 

특정언어로 고정해서 다시 출력

라지 스몰 결과물 오류율을 비교 정리.

Tuesday, December 26, 2023

open ai whisper 기록 및 후기

12.24 openai api 설치 실패


12.25 파이썬 재설치

재설치 해도 안됨 특정 파이썬 버전에서만 실행된다고 함.

구버전 은 3.12 버전에서도 되나 최신버전을 쓰고 싶었다.

3.12 버전으로 하려면 마이그래이션을 해야하는데 공식 openai 문서에 wsl 을 깔아서 하란다.


openai 공식 마이그래이션 가이드

https://github.com/openai/openai-python/discussions/742

마이크로소프트 공식 wsl 설치 가이드 문서

https://learn.microsoft.com/ko-kr/windows/wsl/install


12.26

마이그래이션 가이드로 해 보았는데 안된다. 주요 실패원인은 다음과 같다.

1. grit 사용법을 모른다.

2. git 사용법을 모른다.

3. 애시당초 openai 문서를 자세하게 읽지 않고 대충 해본것


다르게 실행해본다.

파이썬 버전을 낮추어본다.

We used Python 3.9.9 and PyTorch 1.10.1 to train and test our models, but the codebase is expected to be compatible with Python 3.8-3.11 and recent PyTorch versions.


3.10.9버전으로 다시해본다. 파이썬 3.12버전 삭제하고 다시 설치.

chocolatey (윈도우 전용 버전관리 프로그램) 설치. https://goddaehee.tistory.com/294


결과 성공





시사점.

1. 절대 국내 한국어 유투브, 블로그 문서 보고 따라하지 말것.

2. 공식문서만 볼 것.

3. 문서를 자세히 읽어볼 것.

Ruined projects that wasted five years

 1. robot

 faild



 2. game

faild





After two projects failed...



He became an old, sick, poor man.