본문 바로가기
데이터&AI/LLM

GPT로 그림이미지 분석하기 with Python (gpt-4o, 4o-mini)

by 일등박사 2024. 10. 31.
728x90

안녕하세요!!

올해의 3월 포스팅에서 GPT4를 통한 그림 및 사진 읽기에 대하여 알아보았었습니다!!

 

2024.03.26 - [데이터&AI/LLM] - AI모델(GPT4)로 그림 및 사진 읽기 with python

 

AI모델(GPT4)로 그림 및 사진 읽기 with python

오늘은 GPT로 그림및 사진읽기!! 에 대하여 알아보겠습니다!! 사용할 모델은 openai의 GPT 모델인 gpt-4-vision-preview 입니다!! 1. URL 기반으로 그림 읽기!!! target url을 설정하고 해당 이미지를 읽어와서

drfirst.tistory.com

 

그런데!! 이때는 GPT-4만 공개된 시점으로, 값비싼 GPT-4-vision-preview 모델을 사용했었었는데요!

 

 

 

이제는 gpt-4o의 시대!! 4o는 멀티모달로 vision이 되는것 알고계신가요!?

가격 또한 기존 gpt-4-vision-preview에 비하여 적어도 1/3 저렴합니다!! (4o-mini를 쓰면 더더욱 저렴하구요!@)

 

그래서 오늘은 4o 기반으로 다시한번 이미지를 분석해보겠습니다!!

 

지난번 포스팅과 동일한이미지를 분석해볼게요!!


 

import openai

API_KEY = os.getenv('OPENAI_API_KEY')
client = openai.OpenAI(api_key = API_KEY)

my_image_url = 'https://mblogthumb-phinf.pstatic.net/20110105_214/dapapr_1294200472447D2cs9_JPEG/noname08.jpg?type=w420'
my_prompt = '이미지가 어떤 내용인지 해석해줘'


response = client.chat.completions.create(
  model="gpt-4o-mini",
  messages=[
    {
      "role": "user",
      "content": [
        {"type": "text", "text": my_prompt},
        {
          "type": "image_url",
          "image_url": {
            "url": my_image_url,
          },
        },
      ],
    }
  ],
  max_tokens=300,
)

print(response.choices[0].message.content)

 

코드는 간단합니다!! 단지!! 모델 부분만 gpt-4-vision-preview에서 gpt-4o나 gpt-4o-mini로 바꿔주면 끝!!!

 

 

참 좋죠~!! 한개의 모델로 단순 생성부터 이미지 분석까지 가능하다니!!

728x90

댓글