데이터&AI/LLM
GPT로 그림이미지 분석하기 with Python (gpt-4o, 4o-mini)
일등박사
2024. 10. 31. 09:46
안녕하세요!!
올해의 3월 포스팅에서 GPT4를 통한 그림 및 사진 읽기에 대하여 알아보았었습니다!!
2024.03.26 - [데이터&AI/LLM] - AI모델(GPT4)로 그림 및 사진 읽기 with python
AI모델(GPT4)로 그림 및 사진 읽기 with python
오늘은 GPT로 그림및 사진읽기!! 에 대하여 알아보겠습니다!! 사용할 모델은 openai의 GPT 모델인 gpt-4-vision-preview 입니다!! 1. URL 기반으로 그림 읽기!!! target url을 설정하고 해당 이미지를 읽어와서
drfirst.tistory.com
그런데!! 이때는 GPT-4만 공개된 시점으로, 값비싼 GPT-4-vision-preview 모델을 사용했었었는데요!
이제는 gpt-4o의 시대!! 4o는 멀티모달로 vision이 되는것 알고계신가요!?
가격 또한 기존 gpt-4-vision-preview에 비하여 적어도 1/3 저렴합니다!! (4o-mini를 쓰면 더더욱 저렴하구요!@)
그래서 오늘은 4o 기반으로 다시한번 이미지를 분석해보겠습니다!!
지난번 포스팅과 동일한이미지를 분석해볼게요!!
import openai
API_KEY = os.getenv('OPENAI_API_KEY')
client = openai.OpenAI(api_key = API_KEY)
my_image_url = 'https://mblogthumb-phinf.pstatic.net/20110105_214/dapapr_1294200472447D2cs9_JPEG/noname08.jpg?type=w420'
my_prompt = '이미지가 어떤 내용인지 해석해줘'
response = client.chat.completions.create(
model="gpt-4o-mini",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": my_prompt},
{
"type": "image_url",
"image_url": {
"url": my_image_url,
},
},
],
}
],
max_tokens=300,
)
print(response.choices[0].message.content)
코드는 간단합니다!! 단지!! 모델 부분만 gpt-4-vision-preview에서 gpt-4o나 gpt-4o-mini로 바꿔주면 끝!!!
참 좋죠~!! 한개의 모델로 단순 생성부터 이미지 분석까지 가능하다니!!