본문 바로가기
728x90

llm51

구글!! 쌀아있네!! 오픈소스 gen-AI gemma2의 놀라운 한국어 실력 (feat. ollama) https://www.digitaltoday.co.kr/news/articleView.html?idxno=523053 구글 딥마인드, AI 모델 '젬마2' 공개…최대 270억개 파라미터 - 디지털투데이 (DigitalToday)[디지털투데이 AI리포터] 구글 딥마인드가 구글 I/O에서 공개됐던 최첨단 성능의 언어 모델 젬마2(Gemma 2)를 발표했다고 28일(현지시간) 일본 IT미디어가 전했다. 지난 2월 발표된 젬마는 20억개의 파www.digitaltoday.co.kr 24년 6월말!! 구글에서는 Gemma2 모델을 공개했습니다!! Gemma2는 이전 모델에서 한 단계 더 발전한 성능을 자랑하며, 자연어 처리 능력, 머신러닝 효율성, 그리고 실세계 응용 가능성 측면에서 큰 도약을 이뤘다고 자랑하는데.. 2024. 8. 29.
[DCLM] 애플의 LLM 모델 사용해보기 (feat. 19금!?) MS, 구글 등 빅테크 기업들의 LLM모델발표등에 소외되어있던!!애플이 24년 7월 LLM 모델을 공개했습니다!! Large Language Model이라기보단!!소형언어모델(Small Language Model) 로서,애플 기기 냐에서 작동될 수 있도록 하는것을 목표하는것 같은데요!! https://www.aitimes.com/news/articleView.html?idxno=161781 애플, 최강 성능 오픈 소스 sLM ‘DCLM’ 출시..."데이터 큐레이션으로 성능 극대화" - AI타임스애플이 최강 성능의 새로운 오픈 소스 소형언어모델(sLM)을 출시했다. 데이터 큐레이션을 통한 고품질 데이터셋으로 모델을 훈련한 결과라고 주장했다.벤처비트는 19일(현지시간) 애플이 2000토큰www.aitimes.. 2024. 8. 18.
Qwen2 + langchain. On-premise모델을 langchain으로 사용하기! 2024.06.23 - [데이터&AI/LLM] - qwen2 모델 톺아보기 (feat. llama3 모델과의 비교!) qwen2 모델 톺아보기 (feat. llama3 모델과의 비교!)2024.06.23 - [데이터&AI/LLM] - 알리바바의 llm 모델 qwen2 사용해보기 (feat.놀라운 한국어실력) 알리바바의 llm 모델 qwen2 사용해보기 (feat.놀라운 한국어실력)여러가지 오픈소스 모델들을 알아보고있었drfirst.tistory.com 지난 포스팅에서 Qwen2의 모델을 살펴보고, huggingface에서 모델을 다운받아 로드해보고,llama모델과 비교해보았었는데요!!오늘은 이 qwen2 모델을 AutoModelForCausalLM 기반으로, 또 langchain 기반으로 실행해 보겠습니.. 2024. 6. 27.
qwen2 모델 톺아보기 (feat. llama3 모델과의 비교!) 2024.06.23 - [데이터&AI/LLM] - 알리바바의 llm 모델 qwen2 사용해보기 (feat.놀라운 한국어실력) 알리바바의 llm 모델 qwen2 사용해보기 (feat.놀라운 한국어실력)여러가지 오픈소스 모델들을 알아보고있었습니다.2024.05.29 - [데이터&AI/LLM] - 내 서버에서 llama3 실행하기!! (feat. ollama) 내 서버에서 llama3 실행하기!! (feat. ollama)이전 포스팅에서 ollama를 활용하여 ldrfirst.tistory.com  오늘은 지난번 사용해 보았던 qwen2 모델을 llama3모델과 비교하여 분석해보겠습니다~~  1. Qwen2 모델 구조 확인하기from transformers import AutoModelForCausalLM, .. 2024. 6. 24.
728x90