python

[GPT] Tiktoken

으누아빠 2024. 4. 2. 17:29
반응형

모든 splitter는 텍스트의 length를 기준으로 계산하여  한 덩어리의 check 크기를 알아냄
이것을 토큰기준으로 변경

 

from_tiktoken_encoder


OpenAI LLM의 토큰을 계산하는 데 사용
또한 문서를 분할할 때 토큰을 계산하는 데 사용
tictoken은 openAI 에 의해 만들어짐

'python' 카테고리의 다른 글

[GPT] LangChain 한국어 튜터리얼  (0) 2024.04.03
[GPT] Vectors  (0) 2024.04.03
[GPT] Data Loaders and Splitters  (0) 2024.04.02
[GPT] LCEL Based Memory  (0) 2024.03.30
[GPT] Chat Based Memory  (0) 2024.03.30