본문 바로가기
728x90

whisper2

30분이면 자막을 입힌다고?? Whisper AI를 사용해보자 안녕하세요. Acorn입니다! 오늘은 Whisper AI를 사용하여 쉽고 빠르고 정확하게 자막을 만드는 방법을 알아보겠습니다. Whisper AI란? OpenAI에서 개발한 자동 음성 인식(Automatic Speech Recognition, ASR) 모델입니다. 2022년 9월에 오픈 소스로 공개했으며, 2024년 1월 현재는 더욱 개선된 large-v3 모델까지 출시 되었습니다. 여담으로 한국어는 단어 오류율(WER) 통계를 기준으로 27위에 해당한다고 합니다. 순위 통계만 27위일 뿐, 성능은 왠만한 음성 인식 기능보다 뛰어나니 크게 신경쓸 문제는 아닙니다. 1. Google Colab를 사용하여 Whisper AI 설치하기 내 컴퓨터에 설치하는 방식이 아닌, Google Colab 서비스를 이용해.. 2024. 1. 5.
[OpenAI DevDay] OpenAI 개발자 컨퍼런스: GPT-4 Turbo와 새로운 기능들 새벽 3시에 개최된 OpenAI 개발자 컨퍼런스에서는 여러 놀라운 소식들이 전해졌다. 특히, GPT-4 Turbo라는 새로운 모델이 소개되었으며, 이는 128,000 토큰 컨텍스트를 지원한다. 또한, Json 모드를 통해 출력을 json으로만 할 수 있게 되었고, 여러 함수를 한 번에 처리할 수 있는 더 나은 펑션 콜링 기능도 추가되었다. 데이터 학습 기간은 2021년 9월부터 2023년 4월까지로 반영되었으며, 새로운 모달리티, GPT-4 Turbo with vision, 달리3, TTS 등이 API로 사용 가능하게 되었다. 또한, 오픈소스 모델인 Whisper V3도 API로 제공될 예정이다. GPT-4의 가격도 인하되었는데, 인풋 토큰은 3배 저렴하게, 아웃풋 토큰은 2배 저렴하게 조정되었다. 이외.. 2023. 11. 8.
728x90