python

[GPT] Vectors

으누아빠 2024. 4. 3. 16:50
반응형

Embedding


사람이 읽는 텍스트를 컴퓨터가 이해할 수 있는 숫자들로 변환하는 작업

벡터


vectorization[벡터화] 작업을 의미
문서마다 각각의 벡터를 만듬

openAI의 embedding 모델은 최소 1000 차원의 벡터를 제공





남성성 | 여성성 | 왕족성


왕   | 0.9 | 0.1 | 1.0
여왕 | 0.1 | 0.9 | 1.0
남자 | 0.9 | 0.1 | 0.0
여자 | 0.1 | 0.9 | 0.0

단어를 차원으로 표현할때의 장점

다른 단어를 얻기 위해 가진 차원을 더하거나 빼서 새로운 단어를 만들 수 있다.

예를들어 
왕 - 남자 = 0.0 | 0.0 | 1.0  = 왕족
왕족 + 여자 = 0.1 | 0.9 | 1.0 = 여왕

이처럼 벡터에 대한 검색작업을 할수 있으며 이는 유사성을 찾을수 있다는 뜻 

'python' 카테고리의 다른 글

[GPT] Vector Store  (0) 2024.04.03
[GPT] LangChain 한국어 튜터리얼  (0) 2024.04.03
[GPT] Tiktoken  (0) 2024.04.02
[GPT] Data Loaders and Splitters  (0) 2024.04.02
[GPT] LCEL Based Memory  (0) 2024.03.30