본문 바로가기
728x90

nvidia3

Nemotron-4 15B Technical Report 논문 리뷰 안녕하세요 오늘 소개해드릴 논문 리뷰는 Nvidia 의 오픈소스 언어모델 Nemotron-4 15B 입니다. 기존의 엔비디아도 오픈소스 생태계를 위한 언어모델 네모트론을 시리즈별로 발표하기는 했었는데 반응이 그럭저럭이었습니다. 3같은경우 Access 신청을 받아서 써볼수가 있었는데요. 현재 허깅페이스에는 네모트론3가 업로드가 되있긴합니다. nvidia/nemotron-3-8b-base-4k · Hugging Face Nemotron-3-8B-Base-4k Model Overview License The use of this model is governed by the NVIDIA AI Foundation Models Community License Agreement. Description Nemotron.. 2024. 2. 28.
Groq AI 반도체와 아키텍처로 시장의 새로운 패러다임 TSP 안녕하세요 Simon 입니다. 요즘 AI 업계가 기술의 발전의 속도가 ChatGPT 이 후로 가속화를 넘어서 광속화가 진행되고 있는 느낌인데요. Gemini1.5Pro, SorA를 넘어서 더 충격적인 AI 반도체 관련 소식입니다. Groq groq.com 미국 실리콘 밸리의 스타트업 Groq가 텐서스트리밍 프로세서(TSP) 아키텍처를 통해 AI 아키텍처 시장에서 새로운 지평을 열고 있습니다. 이들의 기술은 단일 칩에서 초당 천 조(Peta) 회 작동을 수행하는 놀라운 성능을 자랑하며, 이는 초당 최대 250조의 부동 소수점 연산(FLOPS) 처리 능력을 의미합니다. Groq의 TSP 아키텍처는 기존의 GPU 및 CPU 아키텍처와 달리 동기화 오버헤드 없이 컴퓨팅 유연성과 대규모 병렬성을 제공하는 새로운 .. 2024. 2. 22.
포브스가 선정한 2024년도 AI 예측 10가지 안녕하세요 Simon 입니다. 2024년 새해를 맞아 AI 칼럼니스트 롭 토우(Rob Toews)가 포브스지에 기고한 '2024년 AI 예측 10가지(10 AI Predictions for 2024)' 글을 소개합니다. 1. Nvidia's Cloud Ambitions ( 엔비디아 클라우드의 야망) GPU로 주로 알려진 엔비디아는 클라우드 제공업체가 되기 위한 노력을 강화할 것으로 예측됩니다. 이러한 움직임은 아마존 웹 서비스, 마이크로소프트 애저, 구글 클라우드 플랫폼과 같은 클라우드 회사들이 자체 AI 칩을 개발함에 따라 이들에 대한 의존도를 줄이기 위한 전략적 변화로 보입니다. 엔비디아의 DGX 클라우드는 이 방향으로의 첫 걸음이며, 회사는 자체 데이터 센터를 설립하거나 코어위브와 같은 클라우드 제.. 2024. 1. 2.
728x90