본문 바로가기
데이터&AI/LLM

GPT API의 모델 종류 알아보기 (openai gpt models)- 24년 1월 기준 최신 버전!

by 일등박사 2024. 1. 25.

하루가 다르게 발전하는 Openai 의 GPT!!!

 

2024년 1월 24일 기준으로 모델의 종류를 알아봅시다~!%^^

 

1. 모델 업그레이드 지속 진행!

오픈AI는 지속적으로 언어 모델을 업그레이드하고 있습니다!!

현재기준, 최신 모델 버전은 gpt-3.5-turbo, gpt-4, 그리고 gpt-4-32k입니다!

한 시점의 모델을 사용하고 싶다면  정확한 모델 버전(예: gpt-3.5-turbo-0613)을 사용할수 있어요.

한 모델은 최소 3개월 동안 기존 모델 버전을 유지합니다.

 

기존 모델의 종료 및 신규 모델

 

추천드리는것은은 최신 모델 버전을 사용하는것으로!!

gpt-4 또는 gpt-3.5-turbo와 같은 표준 모델 이름을 사용하세요.

 

2. GPT-4!! 

GPT-4는 최신의 모델로 과거의 모델들보다 뛰어난 정확도로 복잡한 문제를 해결할 수 있는 멀티모달 모델입니다.

(가격이 제일 비싸다는것이 함정,,,)

참 좋은것은 2023년 4월까지의 데이터를 학습하고 있다는 점입니다!

gpt api 비용. 4의 가장 저렴한것도 3.5에 비해 30배 비싼...

GPT-4는 gpt-3.5-turbo와 마찬가지로 채팅에 최적화되어 있어서

Chat Completions API를 사용하여 일반적인 완성 작업에도 잘 작동합니다. 

 

  • 모델들에 대한 설명
    • GPT-4-1106-preview (새로운 GPT-4 Turbo): 더 향상된 명령어 따름, JSON 모드, 재현성 있는 출력, 병렬 함수 호출 등을 제공하는 최신 GPT-4 모델. 최대 4,096개의 출력 토큰을 반환합니다. 이 예시 모델은 아직 제작 환경에 적합하지 않습니다.
    • GPT-4-vision-preview (새로운 GPT-4 Turbo with vision): 이미지 이해 기능을 갖춘 GPT-4 Turbo, 기타 모든 GPT-4 Turbo 기능을 제공합니다. 최대 4,096개의 출력 토큰을 반환합니다. 이 예시 모델 버전은 아직 제작 환경에 적합하지 않습니다.
    • GPT-4: 현재(1.24일 기준) gpt-4-0613을 가리킵니다.  8,192개의 출력 토큰을 반환합니다.
    • GPT-4-32k: 현재 gpt-4-32k-0613을 가리킵니다.  32,768개의 출력 토큰을 반환합니다.
    • GPT-4-0613: 2023년 6월 13일 기준 GPT-4 스냅샷, 8,192개의 출력 토큰을 반환합니다.
    • GPT-4-32k-0613: 2023년 6월 13일 기준 GPT-4-32k 스냅샷, 32,768개의 출력 토큰을 반환합니다.

3. GPT-3.5!! 

GPT-3.5 제품군 중 가장 효과적이고 비용 효율적인 모델은 gpt-3.5-turbo입니다!!

 Chat Completions API를 사용하여 대화에 최적화되어 있습니다!!

아쉬운 점은 여전히 모두 2021년 9월까지의 데이터라는것,,

기억할만한 점은 최신 gpt-3.5-turbo는 컨텍스트 윈도우가 16,385 토큰,  4,096개의 토큰을 생성할 수 있다는 점입니다!

 

모델 설명:


모델명 세부설명 토큰수    
gpt-3.5-turbo-1106
(새로운 업데이트된 GPT-3.5 Turbo)
명령어 따름, JSON 모드, 재현성 있는 출력, 병렬 함수 호출 등이 향상된 최신 GPT-3.5 Turbo 모델. 최대 4,096개의 출력 토큰을 반환합니다. 16,385 토큰 2021년 9월까지
gpt-3.5-turbo 현재 gpt-3.5-turbo-0613을 가리킴. 4,096 토큰 2021년 9월까지
gpt-3.5-turbo-16k 현재 gpt-3.5-turbo-0613을 가리킴. 16,385 토큰 2021년 9월까지
gpt-3.5-turbo-instruct GPT-3 시대 모델과 비슷한 기능. Legacy Completions 엔드포인트와 호환하지만 Chat Completions는 이용 불가. 4,096 토큰 2021년 9월까지 아니요
gpt-3.5-turbo-0613 (레거시) 2023년 6월 13일 기준 gpt-3.5-turbo 스냅샷. 2024년 6월 13일에 사용 중단 예정. 4,096 토큰 2021년 9월까지 아니요
gpt-3.5-turbo-16k-0613 (레거시) 2023년 6월 13일 기준 gpt-3.5-16k-turbo 스냅샷. 2024년 6월 13일에 사용 중단 예정. 16,385 토큰 2021년 9월까지 아니요
gpt-3.5-turbo-0301 (레거시) 2023년 3월 1일 기준 gpt-3.5-turbo 스냅샷. 2024년 6월 13일에 사용 중단 예정. 4,096 토큰 2021년 9월까지 아니요
drive_preadsheetExport to Shee

 

권장사항:

비용이 적고 성능이 향상되었기 때문에 다른 GPT-3.5 모델 대신 gpt-3.5-turbo를 사용하는 것을 추천드립니다~!

 

4. DALL-E! 

DALL·E은 프롬포트를 통하여 이미지와 아트를 생성할 수 있는 AI 시스템입니다. (미드저니가 제일 유명하죠~!)

 

현재 DALL·E 3은 특정 크기의 이미지를 생성하는 능력을 지원하고 있습니다.

DALL·E 3은 Images API를 통해 이용 가능하며, ChatGPT Plus를 통해 DALL·E 3를 시도해 볼 수 있습니다. 

또한 DALL·E 2는 기존 이미지를 편집하거나 사용자가 제공한 이미지의 변형을 생성하는 기능도 지원합니다.

 

  • dall-e-3: 23.11월에 출시된 최신 DALL·E 모델. 
  • dall-e-2: 22.11월에 출시된 이전 DALL·E 모델. 
    원본 모델보다 현실적이고 정확하며 해상도가 4배 더 높은 2번째 버전

5. TTS

TTS는 텍스트를 자연스러운 음성으로 변환하는 AI 모델로 두가지 종류가있습니다!!

모델 설명:

  • tts-1: 최신 텍스트 음성 변환 모델로, 속도에 최적화되어 있습니다.
  • tts-1-hd: 최신 텍스트 음성 변환 모델로, 품질에 최적화되어 있습니다.

6. Whisper (STT 서비스)

Whisper는 일반적인 목적의 음성 인식 모델입니다.

 

이 모델은 다양한 오디오 데이터셋에서 훈련되었으며, 멀티태스크 모델로서 다국어 음성 인식뿐만 아니라 음성 번역 및 언어 식별도 수행할 수 있습니다.

현재 Whisper v2-large 모델은 whisper-1 모델 이름으로 API를 통해 이용 가능합니다.

현재 Whisper의 오픈 소스 버전과 API를 통해 제공되는 버전 사이에는 차이가 없습니다.

그러나 API를 통해 우리는 최적화된 추론 프로세스를 제공하여 Whisper를 API를 통해 실행하는 것이 다른 수단을 통해 실행하는 것보다 훨씬 빠르게 가능합니다. 

 

 

 

ㅁ 참고 : https://platform.openai.com/docs/models

 

댓글