python 55

[GPT][MEETINGGPT] Refine Chain

refine[문서 분할-병합 요약]  입력 문서를 순회하며 반복적으로 답변을 업데이트하여 응답을 구성합니다.  각 문서에 대해, 모든 비문서 입력, 현재 문서, 그리고 최신 중간 답변을 LLM chain에 전달하여 새로운 답변을 얻습니다.     with summary_tab:        start = st.button("Generate summary")        if start:            loader = TextLoader(transcript_path, encoding="utf-8")            docs = loader.load_and_split(text_splitter=splitter)            first_summary_prompt = ChatPromptTempla..

python 2024.05.14

[GPT][MEETINGGPT] Whisper Transcript

whisper란? openai에서 공개한 인공지능 모델로 음성을 텍스트로 변환할 수 있는 기술  def transcribe_chunks(chunk_folder, destination):    if has_transcript:        return    files = glob.glob(f"{chunk_folder}/*.mp3")    files.sort()    for file in files:        with open(file, "rb") as audio_file, open(destination, "a", encoding="utf-8") as text_file:            transcript = openai.Audio.transcribe(                "whisper-1"..

python 2024.05.14

[GPT][MEETINGGPT] Cutting The Audio

pydub pydub은 Python으로 오디오 처리 작업을 수행할 수 있게 하는 유용한 라이브러리 중 하나이 라이브러리를 사용하면 오디오 파일의 생성, 변환, 조작, 재생 속도 변경, 오디오 형식 간 변환 등 다양한 작업을 수행할 수 있음pydub에서 AudioSegment는 오디오 데이터를 나타내는 핵심 객체입이 객체는 여러 오디오 형식(예: MP3, WAV)의 오디오 데이터를 처리하고 다양한 작업을 수행하는 데 사용 설치 pip install pydub from pydub import AudioSegment  def cut_audio_in_chunks(audio_path, chunk_size, chunks_folder):    if has_transcript:        return    track..

python 2024.05.14

[GPT][MEETINGGPT] Audio Extraction

1. ffmpeg 를 설치 해야함 https://ffmpeg.org/ 에서 다운로드를 받음  에서 windows builds from gyan.dev 클릭   원하는 파일 다운로드 여기서는 ffmpeg-release-essentials.zip 다운로드 후 c:\Program Files\ffmpeg에 복사 시스템 환경 변수에 C:\Program Files\ffmpeg\bin 추가  정상적으로 기동하는 지 확인해야함   def extract_audio_from_video(video_path):    if has_transcript:        return    if video.name.endswith("mp3"):        return    audio_path = video_path.replace("m..

python 2024.05.14

[GPT][QUIZGPT]Output Parser 를 이용한 데이터 형태 제어

이전 페이지에서 Formatter Prompt 를 이용하여 원하는 형태로 만든것을 output parser 를 이용하는 형태로 변환 import json from operator import rshift from langchain.document_loaders import UnstructuredFileLoader from langchain.text_splitter import CharacterTextSplitter from langchain.chat_models import ChatOpenAI from langchain.prompts import ChatPromptTemplate from langchain.callbacks import StreamingStdOutCallbackHandler import ..

python 2024.04.18