본문 바로가기

파이썬38

[PYTHON] openai의 gpt api를 활용하여 적은 데이터로 중요도 점수 모델 만들기 안녕하세요!!! 지난 포스팅에서 openai의 gpt api를 활용하여 문장 클러스터링 하는 방법을배워보았습니다! 2023.03.05 - [일등박사의 생각/데이터분석] - [PYTHON] openai의 gpt api를 활용하여 문장 클러스터링 하기 이번에는, 클러스터링을 넘어 나만의 텍스트 중요도 모델을 만들어보겠습니다!! 1. 모듈 임포트 및 선언 - 우선 openai의 api키 와 패키지들을 불러옵니다. - 추가로 앞으로 대화내용을 지속 저장할 신규변수(conversation_history)를 만들어줍니다. import pandas as pd import numpy as np from openai.embeddings_utils import get_embedding from openai.embeddin.. 2023. 3. 6.
OpenAI의 ChatGPT를 파이썬 API로 이용하기(gpt-3.5-turbo) 안녕하세요!!! 미국시간 3/1일! OpenAI사에서 드디어 최신의 GPT를 API서비스로 오픈했습니다!! gpt-3.5-turbo라는 이 신규 API는 1K토큰당 0.002$로, 기존의 GPT api였던 text-davinci-003($0.0200 / 1K tokens) 의 1/10 수준입니다! 그래서!! 오늘은 파이썬을 활용하여 이 신규 API를 이용하는 방법을 함꼐 알아봅시다! 1. openai 패키지 인스톨!! 먼저 여러분의 환경에 openai 패키지를 인스톨해주셔야 합니다! 한국시간으로는 2023년 3월 2일, openai를 업데이트 해주어야하는데요!! 그렇기에 아래와 같이 기존의 openai 패키지를 제거해줍니다! pip uninstall openai (만약 처음 하시는 분이라면 위 작업이 불.. 2023. 3. 4.
정규표현식(regex, 레젝스) with 파이썬!! (3) - 예제 이제!! 실제 정규표현식을 활용한 예제들을 알아보자!! 전화번호 전화번호는 여러방식으로 표현한다!! (010) 0000 0000 (010)0000-0000 010-0000-0000 010 0000 0000 010.0000.0000 이 전화번호들은 아래와 같이 찾을 수 있다 target_sentence = """ (010) 0000 0000 (010)0000-0000 010-0000-0000 010 0000 0000 010.0000.0000 """ my_regex = "\(?010[ -\.]\d+[ -\.]\d+" re.findall(my_regex,target_sentence) 우편번호 우리나라의 우편번호는 간단하다 5개의 숫자로 구성된다 00000 target_sentence = """ 00000 "".. 2023. 1. 9.
정규표현식(regex, 레젝스) with 파이썬!! (2) - 메타문자와 반복 지난 포스팅에 이어 정규표현식에 대하여 알아보겠습니다 2023.01.07 - [일등박사의 생각/데이터분석] - 정규표현식(regex, 레젝스) with 파이썬!! (1) - 기본 정규표현식(regex, 레젝스) with 파이썬!! (1) - 기본 import re 텍스트 작업을 하다보면 필요로하는 텍스트 유형만 산출해야하는 경우가 많습니다! 예를 들면 텍스트 내에서 ~~~@~~~.com 이라는 형식의 이메일 주소만 뽑기 혹은 010-XXXX-XXXX 형식의 전화번 drfirst.tistory.com 메타문자 활용하기 >> \ 앞 부분을 . 을 찾고싶을떄 역슬래시 "\" 를 활용해야 한다고 배웠습니다. 다음 예시를 보아요! target_sentence = """ [일등박사] [이등박사] [삼등박사] [사등.. 2023. 1. 8.