본문 바로가기
728x90

데이터&AI/LLM75

네가 그렇게 수학을 잘하니? Qwen2.5-Math (feat. 오픈소스 LLM) Qwen 2.5 Math: 알리바바가 개발한 새로운 AI 수학 모델 소개 (24년 10월!!)최근 AI 기술의 발전과 함께, 수학 문제 해결을 위한 특화된 모델들이 속속 등장하고 있는데요~~~알리바바 그룹의 AI 연구 부서인 DAMO Academy는 Qwen 2.5 Math라는 최신 모델을 발표하며, 수학 문제 해결 분야에서 뛰어난 성능을 보이고 있습니다.  위 차트에서 보이듯!! 이번 모델은 MATH 점수*에서 엄청  높은 성과를 기록하고 있습니다.* MATH (Mathematical Aptitude Test of Heuristics) 점수란?MATH 데이터셋은 수학 문제 해결을 위한 대표적인 벤치마크로 사용됨!-  이 데이터셋은 고등학교 수준의 복잡한 수학 문제를 포함하고 있어, AI 모델의 수학적 .. 2024. 10. 4.
LLM 모델명 이해하기! (feat. 모델명에 붙은 Instruct 가 무슨뜻이지?) LLM모델의 메카 허깅페이스!!https://huggingface.co/models이  Huggingface를 방문해 보면!! 여러 모델들일 확인할 수 있는데요~~ 오늘은 이 모델들의 이름을 이해하는 방법에 대하여 알아보겠습니다!!! 가장 대표적인 메타의 llama 모델명으로 알아보아요!! Llama-3.1-8B-Instruct위 형식을 보면 4가지로 구성이되어있습니다!!{모델명}-{버전}-{파라미터수}-{Instruct여부} 1. Llama - 모델명모델명!!! 여기서 Llama는 Meta에서 개발한 대형 언어 모델 시리즈로, 다양한 자연어 처리 작업이 가능하다!!그 외에도 GPT-4 (OpenAI), Claude (Anthropic), Falcon (TII), Mistral (Mistral AI), .. 2024. 10. 3.
구글!! 쌀아있네!! 오픈소스 gen-AI gemma2의 놀라운 한국어 실력 (feat. ollama) https://www.digitaltoday.co.kr/news/articleView.html?idxno=523053 구글 딥마인드, AI 모델 '젬마2' 공개…최대 270억개 파라미터 - 디지털투데이 (DigitalToday)[디지털투데이 AI리포터] 구글 딥마인드가 구글 I/O에서 공개됐던 최첨단 성능의 언어 모델 젬마2(Gemma 2)를 발표했다고 28일(현지시간) 일본 IT미디어가 전했다. 지난 2월 발표된 젬마는 20억개의 파www.digitaltoday.co.kr 24년 6월말!! 구글에서는 Gemma2 모델을 공개했습니다!! Gemma2는 이전 모델에서 한 단계 더 발전한 성능을 자랑하며, 자연어 처리 능력, 머신러닝 효율성, 그리고 실세계 응용 가능성 측면에서 큰 도약을 이뤘다고 자랑하는데.. 2024. 8. 29.
[DCLM] 애플의 LLM 모델 사용해보기 (feat. 19금!?) MS, 구글 등 빅테크 기업들의 LLM모델발표등에 소외되어있던!!애플이 24년 7월 LLM 모델을 공개했습니다!! Large Language Model이라기보단!!소형언어모델(Small Language Model) 로서,애플 기기 냐에서 작동될 수 있도록 하는것을 목표하는것 같은데요!! https://www.aitimes.com/news/articleView.html?idxno=161781 애플, 최강 성능 오픈 소스 sLM ‘DCLM’ 출시..."데이터 큐레이션으로 성능 극대화" - AI타임스애플이 최강 성능의 새로운 오픈 소스 소형언어모델(sLM)을 출시했다. 데이터 큐레이션을 통한 고품질 데이터셋으로 모델을 훈련한 결과라고 주장했다.벤처비트는 19일(현지시간) 애플이 2000토큰www.aitimes.. 2024. 8. 18.
728x90