728x90
안녕하세요!!
올해의 3월 포스팅에서 GPT4를 통한 그림 및 사진 읽기에 대하여 알아보았었습니다!!
2024.03.26 - [데이터&AI/LLM] - AI모델(GPT4)로 그림 및 사진 읽기 with python
그런데!! 이때는 GPT-4만 공개된 시점으로, 값비싼 GPT-4-vision-preview 모델을 사용했었었는데요!
이제는 gpt-4o의 시대!! 4o는 멀티모달로 vision이 되는것 알고계신가요!?
가격 또한 기존 gpt-4-vision-preview에 비하여 적어도 1/3 저렴합니다!! (4o-mini를 쓰면 더더욱 저렴하구요!@)
그래서 오늘은 4o 기반으로 다시한번 이미지를 분석해보겠습니다!!
지난번 포스팅과 동일한이미지를 분석해볼게요!!
import openai
API_KEY = os.getenv('OPENAI_API_KEY')
client = openai.OpenAI(api_key = API_KEY)
my_image_url = 'https://mblogthumb-phinf.pstatic.net/20110105_214/dapapr_1294200472447D2cs9_JPEG/noname08.jpg?type=w420'
my_prompt = '이미지가 어떤 내용인지 해석해줘'
response = client.chat.completions.create(
model="gpt-4o-mini",
messages=[
{
"role": "user",
"content": [
{"type": "text", "text": my_prompt},
{
"type": "image_url",
"image_url": {
"url": my_image_url,
},
},
],
}
],
max_tokens=300,
)
print(response.choices[0].message.content)
코드는 간단합니다!! 단지!! 모델 부분만 gpt-4-vision-preview에서 gpt-4o나 gpt-4o-mini로 바꿔주면 끝!!!
참 좋죠~!! 한개의 모델로 단순 생성부터 이미지 분석까지 가능하다니!!
728x90
'데이터&AI > LLM' 카테고리의 다른 글
openai의 assistant api 기능 활용하기(= openai의 threads = openai agent) (1) | 2024.11.02 |
---|---|
reddit의 서브레딧(wallstreetbets) 데이터 모으고 분석하기!! (with python + GPT vision/text) (5) | 2024.11.01 |
Grok-2 beta의 API 활용해보기 (feat. python) (5) | 2024.10.28 |
[realtime GPT를 쓰기위한 사전학습]pyaudio이해하기① (마이크 음성을 데이터로 전환!!!) (1) | 2024.10.22 |
OpenAI의 멀티에이전트 framework SWARM 활용! (example. 페스트푸트 매장 상황) (1) | 2024.10.21 |
댓글