본문 바로가기

728x90

ChatGPT50

앤트로픽, 클로드 3.5 모델 주요 업그레이드 발표 최근 Anthropic이 자사의 AI 모델인 Claude의 대대적인 업그레이드를 발표했습니다. 이번 발표에는 새로운 모델 “Claude 3.5 Sonnet”, 저비용 고성능 “Claude 3.5 Haiku”, 그리고 AI가 컴퓨터 인터페이스와 직접 상호작용할 수 있는 “컴퓨터 사용” 기능이 포함되어 있습니다. 각 모델의 주요 특징과 업그레이드 내용을 살펴보겠습니다. Claude 3.5 Sonnet: 코딩 성능 향상Claude 3.5 Sonnet은 코딩 기능이 크게 향상된 모델로, 다양한 벤치마크에서 높은 성과를 기록했습니다. 주요 성과는 다음과 같습니다:SWE-bench 검증 점수: 기존 33.4%에서 49.0%로 크게 상승하며, 모든 공개 모델을 능가했습니다.TAU-bench 성능 개선: 소매 분야에서.. 2024. 10. 24.

OpenAI의 새로운 혁신, GPT-4o 모델 공개 텍스트, 음성, 영상 처리까지 가능한 멀티모달 AI의 등장 GPT-4o의 주요 특징 요약:무료 텍스트 및 이미지 기능 제공: 무료 사용자도 텍스트와 이미지 분석 기능을 사용할 수 있습니다.멀티 모달 처리: 텍스트, 음성, 영상 데이터를 동시에 입력받아 처리할 수 있습니다.실시간 상호작용: 인간처럼 자연스러운 실시간 대화가 가능합니다.향상된 성능: 기존 모델에 비해 2배 빠른 API와 높은 성능을 제공합니다.다양한 언어 지원: 50개 언어에서 뛰어난 성능을 보이며, 특히 비영어권 언어에서도 높은 효율을 제공합니다. OpenAI가 새로운 인공지능 모델 GPT-4o를 발표했습니다. GPT-4o는 '옴니(omni)'라는 이름처럼 텍스트, 음성, 영상 데이터를 모두 처리할 수 있는 멀티모달 AI 모델입니다. .. 2024. 5. 14.

구글의 차세대 모델 Gemini 1.5 Pro 발표 Gemini 1.5 Pro 안녕하세요 Simon 입니다. 구글이 또 엄청난걸 발표했습니다. 1,000,000개의 context windows를 적재 할 수 있는 Gemini 1.5 Pro 입니다. ChatGPT-4-turbo 가 나왔을떄 132,000개도 대단하다 하는 수치였는데 그 8배의 수치 입니다. 사실 Gemini 가 처음 등장할떄 허위광고다 논문에도 맨 밑에 GPT-4 보다 결국 성능이 안좋은거 아니냐 우려섞인 모습이 많았는데 다 잠식되고 생각보다 안정적인 모델로 평가를 받고 있습니다. 또한 1 Pro 를 무료로 60회 호출 한정해서 쓸 수 있었기 때문에 유저들의 만족을 주지 않았나 생각합니다. Gemini 1.5 Pro ? 구글은 최근 차세대 AI 모델인 제미나이(Gemini) 1.5를 발표했.. 2024. 2. 16.

Open AI 의 새로운 Text to Video SORA 공개 SORA - Text to Video 안녕하세요 Simon입니다. 오늘 새벽은 정말 바쁘네요. 자고 일어났더니 마구마구 쏟아져 나오고 있습니다. Open AI에서 새로운 신기술을 발표했습니다. 언어모델만 잘하는 open AI 가 아니라 2024년은 text to video의 해라고 할 정도로 많은 동영상 관련 생성형 AI 기술이 쏟아지는 가운데 openAI 가 신호탄을 쏟아 올렸습니다. OpenAI가 최근 발표한 Sora 모델은 텍스트 지시에 따라 현실적이고 상상력이 풍부한 장면을 생성할 수 있는 AI 모델입니다. 이 모델은 사용자의 프롬프트에 충실하면서 시각적 품질을 유지하고 최대 1분 길이의 비디오를 생성할 수 있습니다. Sora는 복잡한 장면, 여러 캐릭터, 특정 유형의 움직임, 그리고 주제와 배경.. 2024. 2. 16.

Stream을 아시나요? ChatGPT 를 사용하다보면 기존의 챗봇에서 타자를 마치 사람이 치는것처럼 '타타타타타닥' 하면서 글자들이 출력되곤 하는데요. 챗봇을 구축할때 나도 저걸 할 수 없을까 생각을 한적이 있습니다. 막상 아 그냥 프론트엔드 영역이겠지~ 하고 넘어갔는데요. 손쉽게 구현이 가능 했습니다. Streaming | 🦜️🔗 Langchain All ChatModels implement the Runnable interface, which comes with python.langchain.com LCEL object 에서 stream 이 사용이 가능한데요. 모델이 토큰을 다 생성되고 출력을 해주는게 아니고 생성되는 토큰마다 바로 출력물을 제공하도록 Chunk 단위로 쪼개서 출력을 시켜주는 방식입니다. 여기에 time.s.. 2024. 2. 15.

Ollama를 활용한 VScode 로 Local GithubCopilot 만들기 - (3) Ollama를 활용한 아이폰으로 Ondevice AI 구축하기 안녕하세요 Simon 입니다. On-device AI 시대가 열리면서 삼성의 갤럭시 스마트폰은 AI 를 넣어서 출시가 되고 있고, 아마 최근에 막말로 유명한 샘알트만이 그리는 반도체 시장의 생태계 또한 모든 wiz-tech.tistory.com Ollama를 활용한 맥북 Github Copilot 구축하기 - (2) Ollama를 활용한 아이폰으로 Ondevice AI 구축하기 안녕하세요 Simon 입니다. On-device AI 시대가 열리면서 삼성의 갤럭시 스마트폰은 AI 를 넣어서 출시가 되고 있고, 아마 최근에 막말로 유명한 샘알트 wiz-tech.tistory.com 안녕하세요 이번에는 Ollama를 활용해서 2탄에 mac 의 장점을.. 2024. 2. 15.

Ollama를 활용한 맥북 Github Copilot 구축하기 - (2) Ollama를 활용한 아이폰으로 Ondevice AI 구축하기 안녕하세요 Simon 입니다. On-device AI 시대가 열리면서 삼성의 갤럭시 스마트폰은 AI 를 넣어서 출시가 되고 있고, 아마 최근에 막말로 유명한 샘알트만이 그리는 반도체 시장의 생태계 또한 모든 wiz-tech.tistory.com 안녕하세요 Simon 입니다. Ollama 로 아이폰에 Ondevice 형태의 어플로 구축하는 방법을 소개해드렸는데요. 이어서 M1 시리즈의 노트북을 보유하고 있다면 구독료 없이 코파일럿 형태의 서비스를 쓸 수 있을듯한 Idea가 떠올라서 글을 한번 써보겠습니다. Ollama 는 무엇인가? Ollama 는 오픈소스 프로젝트로 Hype이 되어 더욱 커지고 있는 프레임워크의 Tool 개념이라고 생각합니다... 2024. 2. 15.

Ollama를 활용한 아이폰으로 Ondevice AI 같은 서비스 구축하기 안녕하세요 Simon 입니다. On-device AI 시대가 열리면서 삼성의 갤럭시 스마트폰은 AI 를 넣어서 출시가 되고 있고, 아마 최근에 막말로 유명한 샘알트만이 그리는 반도체 시장의 생태계 또한 모든 디바이스가 AI Chip 이 들어간다면 현실적으로 9000조라는게 가능할?수도 라는 생각이 드는데요. Linkdin Facebook 다양한 AI 관련커뮤니티에서 항상 화제가 되고 있는 Ollama 를 활용한 Application 실행을 해볼려고 합니다. "아이폰에서 LLaMA2 실행하기" Ollama 는 무엇인가? Ollama 는 오픈소스 프로젝트로 Hype이 되어 더욱 커지고 있는 프레임워크의 Tool 개념이라고 생각합니다. Open LLM 에서 Llama 2, Mistral 및 기타 대규모 언어 .. 2024. 2. 15.

Hmm...something seems to have gone wrong ChatGPT 에러 대처 가끔 이런 에러가 뜨곤한다. Hmm...something seems to have gone wrong. error 알수 없는 이유로 뜨곤하는데 갑자기 잘되다가 여러가지 원인을 확인해보는 것을 추천한다. 1. Open AI 서버 확인 https://status.openai.com/ OpenAI Status All Systems Operational API ? Operational 90 days ago 99.88 % uptime Today ChatGPT ? Operational 90 days ago 99.86 % uptime Today Labs ? Operational 90 days ago 99.95 % uptime Today Playground ? Operational 90 days ago 100.0 % .. 2024. 2. 13.

Meta-Prompting:Enhancing Language Models with Task-Agnostic Scaffolding 논문 리뷰 안녕하세요 Simon 입니다. 오늘 소개해드릴 논문은 Meta-Prompting 기법 에 관련된 내용입니다. 제 논문은 보통 한글 번역 후 중요하게 보고 느낀점을 표시해두고, 따로 제 생각을 밑에 적는 편이니 유의하고 읽어주시면 감사하겠습니다. Abstrack 이 논문은 "Meta-Prompting: Enhancing Language Models with Task-Agnostic Scaffolding"이라는 제목으로, Mirac Suzgun(스탠포드 대학)과 Adam Tauman Kalai(OpenAI)에 의해 작성되었습니다. 본 연구에서는 언어 모델(LM)의 기능을 향상시키기 위한 효과적인 지지 구조 방법인 메타 프롬프팅을 소개합니다. 이 접근 방식은 단일 LM을 다양한 독립적인 LM 쿼리를 관리하고 .. 2024. 2. 8.

ChatGPT 의 업데이트 소식 새로운 임베딩 모델 그리고 GPT 업데이트 안녕하세요 Simon 입니다. 오늘은 GPT 의 새로운 업데이트 소식과 유용한 기능의 업데이트 소식을 전달해드리려고 합니다. 새로운 Embedding 모델의 업데이트와 API 의 업데이트 , 그리고 ChatGPT 의 멘션기능까지 OpenAI 가 업데이트를 하였습니다. 지난 1월 4일 부로 기존에 쓰던 임베딩 모델이 없어지고, text-embedding-ada-002를 곧 쭉 쓰고 있었습니다. 파라미터의 변화로 인해서 Embedding() 모델을 선언할떄 디폴트 값이 사라져서 선언이 안되서 모델 이름을 넣어주곤 했는데요. 드디어 Open AI 에서 새로운 임베딩 모델을 가지고 나왔습니다. 그 이름은 text-embedding-3-small, large 입니다. 3탄이란 뜻 같아요. 기존보다 벤치마크 성능이.. 2024. 1. 30.

챗봇 구축 방법론을 생각해보다 챗봇 구축 W5100, W5500, W5100S 과 같이 제품군이 있는 Docs 정보를 토대로 검색증강생성 모델 챗봇을 구축하려고한다. 적용대상 : 실시간 챗봇 우선순위 (1) 포럼 QnA 자동답변기능 (2), 채널톡 자동답변(3) 데이터 : 제품군별 독스 모델이 이해할 수 제품군별 이해하도록 최대한 연관시켜서 재 가공 h/w engineer 가 매달 실제 고객과 상담한 상담내용을 토대로 자체 QnA(faq) 데이터셋 제작 모델 : OpenAI 쓸 예정 모두 (GPT3.5, GPT4) 오픈소스는 성능이 안좋음 , 한국어파인튜닝도 작업해야하는 우려 코드나, 핀맵을 출력하는 경우 token 제한 이슈 적용 방법론: VectorDB all data (Chunk size 고려) ChatGPT - fine-tun.. 2024. 1. 29.

LLM 구조를 파이프라인화해서 랭체인을 쓰면될까? 어제 소프트웨어개발자 의 조언대로 카테고리를 확실히 나누고 목표설정에 대한 구체화를 진행하라는 피드백이 있었다. 번뜩 아이디어가 떠올랐고 AI 관점에서 AI 가 다해주겠지라는 막연한 생각과 함께 구조화 파이프라인을 하지 않았다. 그래서 그런지 항상 파운데이션 모델을 만드는것처럼 뭔가 자꾸 데이터를 합쳐서 튜닝을 한다던지 생각만 했었다. PLM 은 당연히 클러스터링이 잘 되지 않는다면 할루시네이션을 반복할 것이다. 1. RAG기반의 챗봇을 Vector DB를 나눠서 카테고리가 입력한 타겟에 대한 답변을 유도할 수 있도록 한다. -> 포럼 자동봇에는 대응이 가능하다. 포럼자체도 카테고리를 입력해야 글을 쓸 수 있으니 그건 개발자와 협의해서 코드를 수정하면 되는 부분 아마 신뢰성은 많이 올라갈 것이다. 2. .. 2024. 1. 24.

[Langchain] 처음시작하는 랭체인 - (1) 안녕하세요 Simon 입니다. 오늘부터 랭체인 하나는 정복하자 느낌으로 쭉 글을 올려보려고 합니다. 랭체인의 개요, 기초 부터 천천히 하나씩 올리겠습니다. LangChain 이란? • Langchain 은 LLM 기반의 서비스를 구축하기 위한 다양한 모듈과 기능을 제공하는 프레임워크입니다. • 랭체인의 주요 목적은 대화형 AI 시스템을 구축하고 연구하는 데 있어 유용한 도구를 제공하는 것입니다. LangChain 구조 LangChain 라이브러리: 파이썬과 자바스크립트 라이브러리. 다양한 컴포넌트의 인터페이스 및 통합, 이러한 컴포넌트를 체인과 에이전트로 결합하기 위한 기본 런타임, 그리고 체인과 에이전트의 오프더셀프 구현을 포함합니다. LangChain 템플릿: 다양한 작업을 위한 쉽게 배포 가능한 참.. 2024. 1. 24.

LLM 데이터셋 관련 정리 - 대규모 원시 말뭉치 안녕하세요 Simon 입니다. 오늘은 LLM 데이터셋 관련 대규모 말뭉치에 관해 글을 정리해볼까 합니다. 오늘날의 GPT와 같은 모델들은 이 대규모 원시 말뭉치를 통해 Self-Supervised Training 이 되어 다양한 형태로 Fine-Tunning 되어 우리의 일상속에 들어와 있습니다. T5를 시작으로 엄청나게 발전을 많이 했는데요. 저도 2022년에 AI를 입문하게 되었고 자연어처리는 GPT가 나오고 배웠지만 거의 T5가 주류를 이루고 있었는데 현재 지금 엄청 빠르게 발전한 모습이네요. 그렇다면 이 LLM들을 어디서 학습데이터를 구하냐? 바로 우리 곁에 있습니다. 다들 한번쯤 해보신 크롤링을 통해서 데이터를 모을 수 있고, 위에 소개해드린대로 AIhub 와 같은 데이터센터에서 가져올 수 도 .. 2024. 1. 17.

Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 논문 리뷰 - (2) https://wiz-tech.tistory.com/60 Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 논문 리뷰 - (1) 안녕하세요 Simon 입니다. 오늘은 프롬프트 관련 논문에 대해서 리뷰를 하려고 합니다. 좋은 프롬프트를 만드는 26가지 원칙이라고 하는데요 위 논문 리뷰를 통해 보다 GPT를 잘 쓰고 Insight 를 많이 wiz-tech.tistory.com 위 내용을 참조해주시길 바랍니다. 실험 부분부터 다시 리뷰하겠습니다. Experiments 1. Setup and Implementation Details https://github.com/VILA-Lab/ATLAS GitHub - VILA-Lab.. 2024. 1. 15.

Prompt Hacking 에 대응하는 필수 전략 ( GPTs 안전하게 잘쓰는법 ) 지난주 GPTs (GPT Store)가 출시되면서 다양한 GPT들이 공개되었고 많은 사람들이 정말 GPT를 잘 사용하고 있었구나.. 라고 느끼며 반성하는 요즘입니다. 또한 Trending을 이해하는데도 많은 도움이 되고 있는데요, 상위 GPT 들의 Instuction에 대한 순수한 궁금증으로 여러 GPT들의 insturction을 물어보면서 특이한 점을 발견했습니다. 아래 사진처럼 instruction에 보안 프롬프트를 적용시켜놓은 GPT들도 있고 아닌 경우도 있었습니다. 왼쪽의 Grimorie GPT의 경우 instruction 관련 어떠한 질문을 유도를 하더라도 같은 양식이 출력되면서 OpenAI의 정책 상 공개할 수 없다, 대신 coding 관련 질문을 해달라는 식으로 보안 프롬프트가 잘 적용된 모.. 2024. 1. 15.

Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 논문 리뷰 - (1) 안녕하세요 Simon 입니다. 오늘은 프롬프트 관련 논문에 대해서 리뷰를 하려고 합니다. 좋은 프롬프트를 만드는 26가지 원칙이라고 하는데요 위 논문 리뷰를 통해 보다 GPT를 잘 쓰고 Insight 를 많이 얻어갔으면 합니다. https://arxiv.org/abs/2312.16171 Principled Instructions Are All You Need for Questioning LLaMA-1/2, GPT-3.5/4 This paper introduces 26 guiding principles designed to streamline the process of querying and prompting large language models. Our goal is to simplify the und.. 2024. 1. 15.

[Simon] 챗봇개발일지 - (1) RAG 챗봇을 구축하는 과정에서 그냥 Langchain 으로 Document 로더를 통해서 , Finecon, 크로마DB 와 같은 Vector DB 로 임베딩을 한 후 코사인 시밀러 서치를 통해 값을 가져오면 끝? 간단하게 생각을 했다. 사실 아직 제대로 챗봇을 구성해보진 않았다 왜냐면 데이터가 정제가 잘 안되어있는 문제도 있을 뿐더러, 자꾸 만들지도 않고 성능개선에 대한 문제점만 생각을 했다. 처음에 랭체인의 Cookbook 을 따라 쳐보면서 클론코딩을 하면서 어느정도 라이브러리에 대한 이해도를 키웠는데 지금은 많이 이해한 상태이다. 그렇다면 우리 회사의 데이터는 다양한 파일이 존재하는데 이걸 어떻게 결합하지 그 의문이 사실 들었었다. 웹의형태도 있을거고, 그냥 문서를 로드하는 경우도 있을것이다. 그런.. 2024. 1. 11.

ChatGPT Team: 중소기업을 위한 GPT-4 요금제 출시 안녕하세요 Benjamin 입니다. 현재 GPTs. GPT Store가 너무 핫한 상황입니다. 저도 눈뜨자마자 다양한 순위권의 GPTs를 사용해보면서 흥미로운 경험들을 많이 했습니다. 순위권에 있는 GPTs들의 경우에도 Instruction에 따로 보안 프롬프트를 적용하지 않은 경우, 해당 instruction들을 요약해서 확인할 수 있었고, 이를 통해 제가 기존에 사용하던 다양한 GPTs들도 발전시킬 수 있었습니다. 예시로, Kaggle 이나 Dacon 같은 AI Competition에서 도움을 받을 수 있는 Daggle mentor를 만들어보았습니다. ChatGPT - Daggle Mentor Chatbot for coding to win the Dacon & Kaggle competition cha.. 2024. 1. 11.

AI 시대의 새로운 지평 GPT Store의 등장과 그 혁신적인 특징 안녕하세요 Simon 입니다. 드디어 오늘 새벽에 GPTs의 Store가 오픈을 했습니다. 드디어 저도 부자가 될 수 있을까요?🤣 https://chat.openai.com/gpts Explore GPTs Discover and create custom versions of ChatGPT that combine instructions, extra knowledge, and any combination of skills. chat.openai.com 최근 AI 기술의 발전과 함께, 우리의 일상과 업무 환경에 혁신적인 변화가 일어나고 있습니다. 이러한 변화의 최전선에 서 있는 GPT Store가 공개되었다는 소식은 AI 기술의 미래와 그 가능성을 더욱 기대하게 만듭니다. GPT Store는 다양한 GPT 기.. 2024. 1. 11.

Switch Transformers: Scaling to Trillion Parameter Modelswith Simple and Efficient Sparsity 논문 리뷰 안녕하세요 Simon 입니다. 오늘 리뷰해볼 논문은 MoE 모델의 아키텍처인 Switch Transformers 입니다. 사실 제가 딥러닝을 배우기전에 나왔던 논문인데 신기하게 다 언젠가는 빛을 바라는 순간이 오는거 같습니다. Abstrack 스위치 트랜스포머는 전통적인 딥러닝 모델의 한계를 극복하기 위해 개발된 새로운 접근 방식입니다. 기존 모델들이 모든 입력에 대해 동일한 매개변수를 사용하는 반면, 스위치 트랜스포머는 각 입력 예제마다 다른 매개변수를 선택하는 혼합(전문가 혼합) 모델을 채택합니다. 이 방식은 매개변수의 수를 크게 늘리면서도 계산 비용을 일정하게 유지합니다. 그러나 이러한 모델은 복잡성, 통신 비용, 그리고 훈련의 불안정성과 같은 문제들을 가지고 있었습니다. 스위치 트랜스포머는 이러한.. 2024. 1. 8.

포브스가 선정한 2024년도 AI 예측 10가지 안녕하세요 Simon 입니다. 2024년 새해를 맞아 AI 칼럼니스트 롭 토우(Rob Toews)가 포브스지에 기고한 '2024년 AI 예측 10가지(10 AI Predictions for 2024)' 글을 소개합니다. 1. Nvidia's Cloud Ambitions ( 엔비디아 클라우드의 야망) GPU로 주로 알려진 엔비디아는 클라우드 제공업체가 되기 위한 노력을 강화할 것으로 예측됩니다. 이러한 움직임은 아마존 웹 서비스, 마이크로소프트 애저, 구글 클라우드 플랫폼과 같은 클라우드 회사들이 자체 AI 칩을 개발함에 따라 이들에 대한 의존도를 줄이기 위한 전략적 변화로 보입니다. 엔비디아의 DGX 클라우드는 이 방향으로의 첫 걸음이며, 회사는 자체 데이터 센터를 설립하거나 코어위브와 같은 클라우드 제.. 2024. 1. 2.

A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 논문 리뷰 - (2) 안녕하세요 Simon 입니다. 오늘은 A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 논문 리뷰 - (2) 입니다. https://wiz-tech.tistory.com/36 A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 논문 리뷰 -(1) 개발자에게 유용한 Prompt 안녕하세요 Simon 입니다 오늘 소개해드릴 논문은 A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 라는 논문입니다. 이 논문의 배경은 반더빌트 대학에서 GPT를 사용하면서 녹아낸 프롬프트 엔 wiz-tech.tistor.. 2023. 12. 29.

2023년에 나온 인공지능 모델들 안녕하세요 Simon 입니다. 오랜만에 글을 쓰는데요 올해도 다 끝나가고 올 한해 인공지능의 눈부신 발전과 함께 저도 이 분야에 일을 하는 사람으로써 바쁘고 정신없는 한해였지 않나 생각합니다. 올 한해를 통계를 할 겸 올 한해를 빛을 낸 모델들을 소개해드릴려고 합니다. https://journal.everypixel.com/2023-the-year-of-ai 2023: The Year of AI Explore the significant AI advancements, impactful partnerships, and legal debates that defined 2023. journal.everypixel.com 위 내용과 Reddit 에서 올 한해의 2023 AI 모델 관련된 내용이 있어서 분야별로 .. 2023. 12. 29.

A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 논문 리뷰 -(1) 개발자에게 유용한 Prompt 안녕하세요 Simon 입니다 오늘 소개해드릴 논문은 A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 라는 논문입니다. 이 논문의 배경은 반더빌트 대학에서 GPT를 사용하면서 녹아낸 프롬프트 엔지니어링 팁들이 담겨있습니다. Prompt 엔지니어링에 관심이 있으신분들은 위 강의를 꼭 들어보시는 것을 추천을 드립니다. 또 수료하면 자격증이 나오니 그거에 관련해서 링크드인에 자격증을 업로드 할 수 있습니다. 이 외에도 뤼튼에서 진행하고 있는 프롬프톤 WCC 자격증 강의도 수강하시면 좋습니다. Abstrack 이 논문은 대규모 언어 모델(Large Language Models, LLMs)과의 대화에서 사용되는 프롬프트 엔지니어링 기술을 패턴.. 2023. 12. 20.

대규모 언어 모델(Large Language Models, LLMs)에 대한 포괄적 조사 본 내용은 아래 Medium 글을 정리하였습니다. https://cobusgreyling.medium.com/a-comprehensive-survey-of-large-language-models-llms-946a30d9288e 핵심 내용 정리 논문 발표 증가: "대규모 언어 모델"이란 제목이나 초록에 포함된 arXiv 논문의 평균 발표 수가 하루 0.40편에서 8.58편으로 증가 LLM의 원리: 대규모 언어 모델의 진보와 영향에도 불구하고, 그 기본 원리는 아직 잘 탐구되지 않음 오픈 소스 LLM의 역할: Meta의 기여는 중요하며, 오픈 소스 LLM은 확장, 맞춤화 및 성장의 촉매제 역할 LLaMA 모델 활용 연구: 많은 연구자들이 LLaMA 모델을 지시 조정(instruction tuning) 또는 .. 2023. 12. 19.

인간의 지능을 넘은 초지능(Superintelligence) 제어: 오픈AI의 새로운 AGI 감독 방법론 공개 안녕하세요, Benjamin입니다. 오늘은 OpenAI에서 새로운 AGI(인공일반지능) 제어 방법론을 발표했다는 소식을 듣고 전해드리려고합니다. 이제 초거대 AI를 넘어 스스로 생각하는 AGI시대가 열린다는 기사를 여러번 접했었는데, 이번 연구를 통해 인간보다 뛰어난 지능을 가진 AI를 어떻게 제어할 수 있는 지에 대해 본격적으로 생각해보게 되었습니다. Open AI의 이번 발표는 기존의 AI 연구 방향과는 다른 새로운 접근 방식을 제시합니다. 간단히 말해, '약한 감독자' 즉, 저지능의 모델이 더 강력한 AI 모델을 어떻게 효과적으로 감독하고 제어할 수 있는지에 대한 연구인데요. OpenAI 연구팀은 GPT-2 수준의 모델로 GPT-4와 유사한 감독 성능을 달성했다고 합니다. 이는 비록 작은 모델이지만.. 2023. 12. 18.

Nature's 10 올해를 빛낸 10인의 과학자 중 비인간 1명 ChatGPT 2023년 12월 14일, 세계적인 과학 저널인 《자연》(Nature)은 2023년의 10대 과학 인물을 발표했다. 이 중에는 흥미롭게도 한 개의 인공지능 모델이 포함되어 있었다. 바로 OpenAI에서 개발한 대규모 언어 모델인 ChatGPT이다. 이외에도, 과학 분야에 괄목할 만한 성과를 거둔 10명의 인물이 선정되었다. 그들의 혁신적인 업적은 다음과 같다. 카르파나 카라하스티(Kalpana Kalahasti)는 인도 우주 연구 위원회(ISRO)의 "달나라 탐사선" 프로젝트의 부책임자이다. 그녀는 이 프로젝트를 통해 인도 최초로 달 표면에 착륙하는 데 성공했다. 안니 크리체르(Annie Kritcher)는 미국 국립 점화 장치(NIF)의 수석 설계자이다. 그녀는 NIF를 통해 핵융합 에너지를 실현하기 .. 2023. 12. 15.

[Langchain] 평점기반의 맛집 RAG LLM 구축하기 안녕하세요 Simon 입니다. 이번에 소개해드릴 컨텐츠는 Langchain 을 활용해서 보다 쉽게 RAG 서비스를 구축하는 방법입니다. 다들 맛집 좋아하실텐데 평점을 얼마나 믿으시는지는 모르겠습니다. 사실 구축단계에서 한국 사람들이 아무래도 네이버라는 플랫폼을 많이쓰고 신뢰하고 정보도 많기 때문에 NAVER API 를 활용하고 싶었으나, 진짜 감촉같이 이거 조금만 api 데이터쓰면 item 이다 할만한것만 지원을 하지 않는 모습이더라구요. 그래서 더욱 범용적인 Google maps 를 활용해서 만들어보았습니다. 이전에 사실 카카오톡맵기반으로 크롤링을 해서 데이터를 구축해서 만들려고 시도를 해보았으나, 자꾸 동적페이지 다음페이지 넘어가면서 Chrome Driver 가 오류가 나는 바람에 데이터를 구축하지를.. 2023. 12. 15.

이전 1 2 다음

728x90

티스토리툴바