python

[GPT][MEETINGGPT] Whisper Transcript

으누아빠 2024. 5. 14. 12:39
반응형

whisper란?
openai에서 공개한 인공지능 모델로 음성을 텍스트로 변환할 수 있는 기술

 

 

def transcribe_chunks(chunk_folder, destination):
    if has_transcript:
        return
    files = glob.glob(f"{chunk_folder}/*.mp3")
    files.sort()
    for file in files:
        with open(file, "rb") as audio_file, open(destination, "a", encoding="utf-8") as text_file:
            transcript = openai.Audio.transcribe(
                "whisper-1",
                audio_file,
            )
            text_file.write(transcript["text"])

 

glob.glob()
특정한 패턴이나 확장자를 가진 파일들의 경로나 이름이 필요할 때가 있음

glob 모듈의 glob 함수는 사용자가 제시한 조건에 맞는 파일명을 리스트 형식으로 반환

단, 조건에 정규식을 사용할 수 없으며 엑셀 등에서도 사용할 수 있는 '*'와 '?'같은 와일드카드만을 지원

'python' 카테고리의 다른 글

[GPT][MEETINGGPT] 최종 예제  (0) 2024.05.14
[GPT][MEETINGGPT] Refine Chain  (0) 2024.05.14
[GPT][MEETINGGPT] Cutting The Audio  (0) 2024.05.14
[GPT][MEETINGGPT] Audio Extraction  (0) 2024.05.14
[GPT][SITEGPT] Map Re Rank Chain  (0) 2024.05.13