[GPT][문서검색] Streaming

python

[GPT][문서검색] Streaming

으누아빠 2024. 4. 15. 19:31

실시간으로 텍스트를 노출시키는 방법 임

문서검색의 최종본

from langchain.prompts import ChatPromptTemplate

from langchain.document_loaders import UnstructuredFileLoader

from langchain.embeddings import CacheBackedEmbeddings, OpenAIEmbeddings

from langchain.schema.runnable import RunnableLambda, RunnablePassthrough

from langchain.storage import LocalFileStore

from langchain.text_splitter import CharacterTextSplitter

from langchain.vectorstores.faiss import FAISS

from langchain.chat_models import ChatOpenAI

from langchain.callbacks.base import BaseCallbackHandler

import streamlit as st

st.set_page_config(

page_title="DocumentGPT",

page_icon="📃",

)

class ChatCallbackHandler(BaseCallbackHandler):

message = ""

def on_llm_start(self, *args, **kwargs):

self.message_box = st.empty()

def on_llm_end(self, *args, **kwargs):

save_message(self.message, "ai")

def on_llm_new_token(self, token, *args, **kwargs):

self.message += token

self.message_box.markdown(self.message)

llm = ChatOpenAI(

temperature=0.1,

streaming=True,

callbacks=[

ChatCallbackHandler(),

)

@st.cache_data(show_spinner="Embedding file...")

def embed_file(file):

file_content = file.read()

file_path = f"./.cache/files/{file.name}"

with open(file_path, "wb") as f:

f.write(file_content)

cache_dir = LocalFileStore(f"./.cache/embeddings/{file.name}")

splitter = CharacterTextSplitter.from_tiktoken_encoder(

separator="\n",

chunk_size=600,

chunk_overlap=100,

)

loader = UnstructuredFileLoader(file_path)

docs = loader.load_and_split(text_splitter=splitter)

embeddings = OpenAIEmbeddings()

cached_embeddings = CacheBackedEmbeddings.from_bytes_store(embeddings, cache_dir)

vectorstore = FAISS.from_documents(docs, cached_embeddings)

retriever = vectorstore.as_retriever()

return retriever

def save_message(message, role):

st.session_state["messages"].append({"message": message, "role": role})

def send_message(message, role, save=True):

with st.chat_message(role):

st.markdown(message)

if save:

save_message(message, role)

def paint_history():

for message in st.session_state["messages"]:

send_message(

message["message"],

message["role"],

save=False,

)

def format_docs(docs):

return "\n\n".join(document.page_content for document in docs)

prompt = ChatPromptTemplate.from_messages(

[

(

"system",

"""

Answer the question using ONLY the following context. If you don't know the answer just say you don't know. DON'T make anything up.

Context: {context}

""",

("human", "{question}"),

]

)

st.title("DocumentGPT")

st.markdown(

"""

Welcome!

Use this chatbot to ask questions to an AI about your files!

Upload your files on the sidebar.

"""

)

with st.sidebar:

file = st.file_uploader(

"Upload a .txt .pdf or .docx file",

type=["pdf", "txt", "docx"],

)

if file:

retriever = embed_file(file)

send_message("I'm ready! Ask away!", "ai", save=False)

paint_history()

message = st.chat_input("Ask anything about your file...")

if message:

send_message(message, "human")

chain = (

{

"context": retriever | RunnableLambda(format_docs),

"question": RunnablePassthrough(),

}

| prompt

| llm

)

with st.chat_message("ai"):

chain.invoke(message)

else:

st.session_state["messages"] = []

'python' 카테고리의 다른 글

[GPT][PRIVATEGPT] HuggingFacePipeline (0)	2024.04.16
[GPT][PRIVATEGPT]HuggingFaceHub (0)	2024.04.16
[GPT][문서 검색] Chain (0)	2024.04.15
[GPT][문서검색] Chat History (0)	2024.04.15
[GPT][문서검색] Uploading Documents (0)	2024.04.15

현재글[GPT][문서검색] Streaming

250x250

ConversationSummaryBufferMemory, ES6, 배포, javascript, mongodb, IOS, chain, LCEL, 유튜브, 진도, 안드로이드, ChatPromptTemplate, RAG, 중보, 시사, 보수, 진보, MessagesPlaceholder, 중도, Flutter,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

OUR + YOUR SPACE