GPT로 그림이미지 분석하기 with Python (gpt-4o, 4o-mini)

안녕하세요!!

올해의 3월 포스팅에서 GPT4를 통한 그림 및 사진 읽기에 대하여 알아보았었습니다!!

2024.03.26 - [데이터&AI/LLM] - AI모델(GPT4)로 그림 및 사진 읽기 with python

AI모델(GPT4)로 그림 및 사진 읽기 with python

오늘은 GPT로 그림및 사진읽기!! 에 대하여 알아보겠습니다!! 사용할 모델은 openai의 GPT 모델인 gpt-4-vision-preview 입니다!! 1. URL 기반으로 그림 읽기!!! target url을 설정하고 해당 이미지를 읽어와서

drfirst.tistory.com

그런데!! 이때는 GPT-4만 공개된 시점으로, 값비싼 GPT-4-vision-preview 모델을 사용했었었는데요!

이제는 gpt-4o의 시대!! 4o는 멀티모달로 vision이 되는것 알고계신가요!?

가격 또한 기존 gpt-4-vision-preview에 비하여 적어도 1/3 저렴합니다!! (4o-mini를 쓰면 더더욱 저렴하구요!@)

그래서 오늘은 4o 기반으로 다시한번 이미지를 분석해보겠습니다!!

지난번 포스팅과 동일한이미지를 분석해볼게요!!

import openai

API_KEY = os.getenv('OPENAI_API_KEY')
client = openai.OpenAI(api_key = API_KEY)

my_image_url = 'https://mblogthumb-phinf.pstatic.net/20110105_214/dapapr_1294200472447D2cs9_JPEG/noname08.jpg?type=w420'
my_prompt = '이미지가 어떤 내용인지 해석해줘'


response = client.chat.completions.create(
  model="gpt-4o-mini",
  messages=[
    {
      "role": "user",
      "content": [
        {"type": "text", "text": my_prompt},
        {
          "type": "image_url",
          "image_url": {
            "url": my_image_url,
          },
        },
      ],
    }
  ],
  max_tokens=300,
)

print(response.choices[0].message.content)

코드는 간단합니다!! 단지!! 모델 부분만 gpt-4-vision-preview에서 gpt-4o나 gpt-4o-mini로 바꿔주면 끝!!!

참 좋죠~!! 한개의 모델로 단순 생성부터 이미지 분석까지 가능하다니!!

저작자표시 비영리 동일조건 (새창열림)

'데이터&AI > LLM' 카테고리의 다른 글

openai의 assistant api 기능 활용하기(= openai의 threads = openai agent) (1)	2024.11.02
reddit의 서브레딧(wallstreetbets) 데이터 모으고 분석하기!! (with python + GPT vision/text) (5)	2024.11.01
Grok-2 beta의 API 활용해보기 (feat. python) (5)	2024.10.28
[realtime GPT를 쓰기위한 사전학습]pyaudio이해하기① (마이크 음성을 데이터로 전환!!!) (1)	2024.10.22
OpenAI의 멀티에이전트 framework SWARM 활용! (example. 페스트푸트 매장 상황) (1)	2024.10.21

일등박사의 연구소

GPT로 그림이미지 분석하기 with Python (gpt-4o, 4o-mini)

'데이터&AI > LLM' 카테고리의 다른 글

댓글

티스토리툴바

GPT로 그림이미지 분석하기 with Python (gpt-4o, 4o-mini)

'데이터&AI > LLM' 카테고리의 다른 글

관련글

댓글

티스토리툴바