본문 바로가기
728x90

llm39

ollama 의 모델 저장 디렉토리 바꾸기!! 다양한 LLM opensource 모델들을 손쉽게 사용할 수 있는 Ollama 가 오픈되어 공부중인데요~!@ https://ollama.ai/ Ollama Get up and running with large language models, locally. ollama.ai 3.8GB의 LLAMA 7B 모델부터 39GB가 넘는 LLAMA2 70B 모델까지 여러 공개된 오픈소스 모델들의 사용이 가능합니다! https://ollama.ai/library/llama2-uncensored/tags Tags · llama2-uncensored Uncensored Llama 2 model by George Sung and Jarrad Hope. ollama.ai 70B등 대규모 모델을 사용하다보면, 현 디렉토리 용량.. 2023. 12. 26.
LLM 모델 팔콘 알아보기 (Falcon-180b) 오늘은 HuggingFace에 TII가 소개한 초거대언어모델(LLM)인 Falcon 180B를 알아보고자합니다!! ㅁ 모델 소개 및 배경 Falcon 180B는 현재까지 공개된 오픈소스 모델중 최고라고할수 있습니다!! 약 1800억 개의 매개변수를 가진 가장 큰 개방된 언어 모델로 기존에 공개되었던 Falcon 40B의 확장된 버전으로 다중 쿼리 어텐션( multiquery attention ) 같은 혁신을 바탕으로 개발되었습니다 모델 제작시에는 딥러닝 클라우드 서비스인 Amazon SageMaker를 바탕으로 최대 4096개의 GPU를 동시에 사용, 3.5조 개의 토큰으로 훈련되었습니다. (Llama 2보다 2.5배 더 크고 4배 더 많은 컴퓨팅으로 훈련되었다는 것을 의미합니다.) ㅁ 성능비교 Falc.. 2023. 12. 2.
초거대언어모델(LLM) 의 성능평가지표 (feat. MMLU, Helloswag) chatGPT로 부터 시작된 초거대 언어모델 경쟁!! Meta의 LLaMa, Google의 Palm 그리고 이로 부터 파생된 Alpace, Falcon 등 여러 LLM 모델들이 공개되고있는데요! 2023.04.12 - [일등박사의 생각/데이터분석] - GPT를 On-premise에서 사용하고 싶을때는?? GPT를 On-premise에서 사용하고 싶을때는?? GPT의 시대입니다. 하루가 다르게 다양한 기술들이 나오고 있습니다 GPT plugin 이 개발되어 적시성을 필요로하는 데이터도 바로바로 GPT를 통해 볼 수 있게되고 GPT-Index(LLaMa-index)를 통하여 PDF, 위키 drfirst.tistory.com 각각의 모델들은 서로가 자기들의 성능이 좋다며 여러 지표로서 그 의미를 증명합니다!!.. 2023. 12. 1.
728x90