전체 글 486

[GPT][INVESTORGPT] Search Tool

DuckDuckGoSearch를 이용하여 해당 search에서 데이터를 가져와 답변하도록 한다.  from typing import Typefrom langchain.chat_models import ChatOpenAIfrom langchain.tools import BaseToolfrom pydantic import BaseModel,Fieldfrom langchain.agents import initialize_agent, AgentTypefrom langchain.utilities import DuckDuckGoSearchAPIWrapperllm = ChatOpenAI(    temperature=0.1,)class StockMarketSymbolSearchToolArgsSchema(BaseMode..

python 2024.05.20

[GPT][INVESTORGPT] OpenAI Functions Agent

OPENAI_FUNCTIONS이경우 데이터의 형태를 지정하지 않으면 오류를 발생함 InvalidRequestError: Invalid 'functions[0].name': string does not match pattern. Expected a string that matches the pattern '^[a-zA-Z0-9_-]+$'.  from typing import Typefrom langchain.chat_models import ChatOpenAIfrom langchain.tools import BaseToolfrom pydantic import BaseModel,Fieldfrom langchain.agents import initialize_agent, AgentTypellm = ChatOp..

python 2024.05.20

[GPT][MEETINGGPT] Refine Chain

refine[문서 분할-병합 요약]  입력 문서를 순회하며 반복적으로 답변을 업데이트하여 응답을 구성합니다.  각 문서에 대해, 모든 비문서 입력, 현재 문서, 그리고 최신 중간 답변을 LLM chain에 전달하여 새로운 답변을 얻습니다.     with summary_tab:        start = st.button("Generate summary")        if start:            loader = TextLoader(transcript_path, encoding="utf-8")            docs = loader.load_and_split(text_splitter=splitter)            first_summary_prompt = ChatPromptTempla..

python 2024.05.14

[GPT][MEETINGGPT] Whisper Transcript

whisper란? openai에서 공개한 인공지능 모델로 음성을 텍스트로 변환할 수 있는 기술  def transcribe_chunks(chunk_folder, destination):    if has_transcript:        return    files = glob.glob(f"{chunk_folder}/*.mp3")    files.sort()    for file in files:        with open(file, "rb") as audio_file, open(destination, "a", encoding="utf-8") as text_file:            transcript = openai.Audio.transcribe(                "whisper-1"..

python 2024.05.14

[GPT][MEETINGGPT] Cutting The Audio

pydub pydub은 Python으로 오디오 처리 작업을 수행할 수 있게 하는 유용한 라이브러리 중 하나이 라이브러리를 사용하면 오디오 파일의 생성, 변환, 조작, 재생 속도 변경, 오디오 형식 간 변환 등 다양한 작업을 수행할 수 있음pydub에서 AudioSegment는 오디오 데이터를 나타내는 핵심 객체입이 객체는 여러 오디오 형식(예: MP3, WAV)의 오디오 데이터를 처리하고 다양한 작업을 수행하는 데 사용 설치 pip install pydub from pydub import AudioSegment  def cut_audio_in_chunks(audio_path, chunk_size, chunks_folder):    if has_transcript:        return    track..

python 2024.05.14

[GPT][MEETINGGPT] Audio Extraction

1. ffmpeg 를 설치 해야함 https://ffmpeg.org/ 에서 다운로드를 받음  에서 windows builds from gyan.dev 클릭   원하는 파일 다운로드 여기서는 ffmpeg-release-essentials.zip 다운로드 후 c:\Program Files\ffmpeg에 복사 시스템 환경 변수에 C:\Program Files\ffmpeg\bin 추가  정상적으로 기동하는 지 확인해야함   def extract_audio_from_video(video_path):    if has_transcript:        return    if video.name.endswith("mp3"):        return    audio_path = video_path.replace("m..

python 2024.05.14