본문 바로가기
728x90

openai44

[STT] 녹음파일에서 텍스트 추출하기!! by OpenAI Whisper(feat python) 최근 몇 년 동안, 음성 인식 기술의 발전은 놀라웠습니다.다양한 응용 프로그램에서 음성을 텍스트로 변환하는 기능즉!! STT (Speech-To-Text)는 많은 편리함을 제공하고 있습니다.특히 OpenAI의 Whisper는 그 성능이 어마어마한데요!!그래서를  Python으로 해당 모델을 활용, 녹음 파일로부터 텍스트를 추출하는 방법을 알아보아요~~.Whisper란 무엇인가요?Whisper는 OpenAI에서 개발한 음성 인식 모델로,다양한 언어와 억양을 인식할 수 있는 강력한 도구입니다.이 모델은 높은 정확도를 자랑하며, 특히 다양한 환경에서 녹음된 음성을 처리하는 데 탁월한 성능을 발휘합니다.또한 언어를 자동으로 감지하여 텍스트로 전환해줍니다!!! Python Code!오늘의 작업을 위해서는!!파이썬.. 2024. 6. 8.
LangChain 캐싱: GPT비용을 줄이고 속도는 높이기!!(feat python) GPT한태 똑같은 질문을 여러사람이 여러번 할수 있지 않을까요?? 그런데 그때마다 GPT API를 호출한다면??매번 GPT 답변받느라 속도도 느려지고, API를 계속 호출하느라 비용도 비싸겠찌요? 이를 대비해서!!LangChain의 caching 기능을 사용하면됩니다!!. 캐싱이란 무엇인가요?캐싱은 이전에 계산된 결과를 저장해두고, 동일한 입력이 들어왔을 때 다시 계산하지 않고 저장된 결과를 재사용하는 기술입니다.  LangChain에서 캐싱은 LLM 호출 결과를 저장하고, 동일한 프롬프트에 대해서는 LLM을 다시 호출하지 않고 캐시된 결과를 반환합니다.LangChain 캐싱 사용 방법LangChain의 캐싱은 크게 2가지 방법으로 사용 가능합니다!!  방법1. 메모리캐시 사용from langchain... 2024. 5. 28.
[HyperCLOVA] 문장을 벡터로 임베딩하기 (with Python) 2024.02.13 - [데이터&AI/langchain] - [langchain공부]유로 임베딩 모델 사용하기!? (feat. OpenAI ada) [langchain공부]유로 임베딩 모델 사용하기!? (feat. OpenAI ada)많이 사용하는 huggingface의 BERT 모델! model_huggingface = HuggingFaceEmbeddings(model_name = 'jhgan/ko-sroberta-multitask' , model_kwargs = {'device':'cpu'} , encode_kwargs = {'normalize_embeddings' : True}) 위와 같은 방식으로 로드하drfirst.tistory.com 예전 포스팅에서 OpenAI의 API를 통하여 문장을 임베딩.. 2024. 5. 23.
파이썬 langchain 활용기반, 쉽게 챗봇사이트 만들기 (gradio) streamlit에 이어파이썬의 기본 기능과 langchain 기능을 결합,쉽게 챗봇사이트를 만들도록 도와주는 그라디어 (Gradio)의 사용방법에 대하여 알아보겠습니다!!  1. pip 로 패키지 설치!! pip install gradio  2. 패키지 로드!! 이번에는 gpt3.5를 사용해보겠습니다!!from langchain_core.output_parsers import StrOutputParserfrom langchain_core.prompts import ChatPromptTemplatefrom langchain.chat_models import ChatOpenAImodel = "gpt-3.5-turbo"## 모델설정chatgpt35 = ChatOpenAI(temperature=0, mode.. 2024. 5. 18.
728x90