본문 바로가기
728x90

전체 글107

Switch Transformers: Scaling to Trillion Parameter Modelswith Simple and Efficient Sparsity 논문 리뷰 안녕하세요 Simon 입니다. 오늘 리뷰해볼 논문은 MoE 모델의 아키텍처인 Switch Transformers 입니다. 사실 제가 딥러닝을 배우기전에 나왔던 논문인데 신기하게 다 언젠가는 빛을 바라는 순간이 오는거 같습니다. Abstrack 스위치 트랜스포머는 전통적인 딥러닝 모델의 한계를 극복하기 위해 개발된 새로운 접근 방식입니다. 기존 모델들이 모든 입력에 대해 동일한 매개변수를 사용하는 반면, 스위치 트랜스포머는 각 입력 예제마다 다른 매개변수를 선택하는 혼합(전문가 혼합) 모델을 채택합니다. 이 방식은 매개변수의 수를 크게 늘리면서도 계산 비용을 일정하게 유지합니다. 그러나 이러한 모델은 복잡성, 통신 비용, 그리고 훈련의 불안정성과 같은 문제들을 가지고 있었습니다. 스위치 트랜스포머는 이러한.. 2024. 1. 8.
2023년 GitHub 하이라이트 AI 혁신부터 보안 강화까지, 올해의 주목할 만한 기술 동향 안녕하세요 Simon 입니다 벌써 1월의 둘째주가 시작되고 있는데 다들 신년계획은 잘 하고 계신지 모르겠습니다. 다들 연말, 신년에 보통 이전년도를 회고를 하는 게시물이 많이 올라옵니다. Github 에서도 통계글이 올라왔는데요 재밌고 github 자체로 S/W 시장의 흐름과 트렌드가 무엇인지 알 수 있을거 같아서 가지고 왔습니다. https://github.blog/2023-12-27-githubs-top-blog-posts-of-2023/ GitHub’s top blog posts of 2023 As the year winds down, we're highlighting some of the incredible work from GitHub’s engineers, product teams, and s.. 2024. 1. 8.
30분이면 자막을 입힌다고?? Whisper AI를 사용해보자 안녕하세요. Acorn입니다! 오늘은 Whisper AI를 사용하여 쉽고 빠르고 정확하게 자막을 만드는 방법을 알아보겠습니다. Whisper AI란? OpenAI에서 개발한 자동 음성 인식(Automatic Speech Recognition, ASR) 모델입니다. 2022년 9월에 오픈 소스로 공개했으며, 2024년 1월 현재는 더욱 개선된 large-v3 모델까지 출시 되었습니다. 여담으로 한국어는 단어 오류율(WER) 통계를 기준으로 27위에 해당한다고 합니다. 순위 통계만 27위일 뿐, 성능은 왠만한 음성 인식 기능보다 뛰어나니 크게 신경쓸 문제는 아닙니다. 1. Google Colab를 사용하여 Whisper AI 설치하기 내 컴퓨터에 설치하는 방식이 아닌, Google Colab 서비스를 이용해.. 2024. 1. 5.
오픈리더보드의 평가지표에 대해 안녕하세요 Simon 입니다. 오늘은 Open LLM Leaderboard 에서 순위를 평가하는 지표에 대해서 자세히 알아보겠습니다. https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard Open LLM Leaderboard - a Hugging Face Space by HuggingFaceH4 huggingface.co 평가방식(Im-evaluation-harness) - 질문과 보기를 모델에 입력을 합니다. - 각 보기를 생성할 확률을 통해 예측을 수행합니다. - In-context Learning 을 위해 예제를 함께 삽입합니다. 질문 : 인구가 제일 많은 나라는? 보기 : (1) 중국 (2) 한국 (3) 미국 (4) 일본 [모델의 추론.. 2024. 1. 4.
SOLAR 10.7B: Scaling Large Language Models with Simple yet EffectiveDepth Up-Scaling 논문리뷰 안녕하세요 Simon입니다. 오늘 소개해드릴 논문은 SOLAR 10.7B에 관한 논문입니다. 지금 FastCampus에서 Upstage의 파인튜닝 노하우 강의를 듣고 있는데 김성훈 CEO가 소개해준 내용과 연관해서 리뷰를 해보겠습니다. 강의를 수강하는데 계속 웃음꽃이 떠나질 않는 거 보면 확실히 현재 제일 hot 한 최전선에 있는 분야에서 최고가 된 만큼 얼마나 기쁠까 생각이 들긴 합니다. LLM의 평가지표는 여러가지가 있습니다. H4는 4개의 데이터셋으로 평가한다는 의미인데요, 현재 H7 까지도 증가해서 평가를 받고 있습니다. 그말은 즉슨 H4에서의 벤치마크가 높은데 H7에서는 떨어진다? 이 말은 모델이 그만큼 일반화가 되지 않은 모델이라고 생각해 볼 수 있습니다. LLM 평가지표에 대한 글은 제가 다.. 2024. 1. 4.
RAGTruth: A Hallucination Corpus for Developing Trustworthy Retrieval-Augmented Language Models 논문 리뷰 안녕하세요 Simon 입니다. 오늘 소개해드릴 논문은 RAG 관련 논문입니다. 아무래도 RAG가 이제 많이 알려지기도 했고 LLM 의 필수요소로 자리잡고 있습니다. 저희도 일단 RAG 자체는 완벽히 이해하고 구현을 하자 느낌이 강해서 새로운 논문을 리딩한번 해보겠습니다. Abstract 위 논문은 할루시네이션을 줄이기위해 RAG 검색증강 생성을 사용하였지만 여전히 검색내용과 모순되거나 뒷받침 되지 않는 주장을 할 수 있다는 것을 개선하기 위해 RAGTruth라는 코퍼스를 제시합니다. 연구는 다른 LLM들에서 환각 빈도를 비교하고, 기존 환각 탐지 방법의 효과를 평가합니다. 또한, 고품질 데이터셋을 사용하여 작은 LLM을 미세 조정함으로써, 최신 대규모 모델을 사용하는 기존 방법과 경쟁할 수 있는 환각 탐.. 2024. 1. 3.
포브스가 선정한 2024년도 AI 예측 10가지 안녕하세요 Simon 입니다. 2024년 새해를 맞아 AI 칼럼니스트 롭 토우(Rob Toews)가 포브스지에 기고한 '2024년 AI 예측 10가지(10 AI Predictions for 2024)' 글을 소개합니다. 1. Nvidia's Cloud Ambitions ( 엔비디아 클라우드의 야망) GPU로 주로 알려진 엔비디아는 클라우드 제공업체가 되기 위한 노력을 강화할 것으로 예측됩니다. 이러한 움직임은 아마존 웹 서비스, 마이크로소프트 애저, 구글 클라우드 플랫폼과 같은 클라우드 회사들이 자체 AI 칩을 개발함에 따라 이들에 대한 의존도를 줄이기 위한 전략적 변화로 보입니다. 엔비디아의 DGX 클라우드는 이 방향으로의 첫 걸음이며, 회사는 자체 데이터 센터를 설립하거나 코어위브와 같은 클라우드 제.. 2024. 1. 2.
SELF-RAG: LEARNING TO RETRIEVE, GENERATE, AND CRITIQUE THROUGH SELF-REFLECTION 논문 리뷰 오늘 리뷰할 논문은 SELF-RAG:LEARNING TO RETRIEVE, GENERATE, AND CRITIQUE THROUGH SELF-REFLECTION 입니다. https://arxiv.org/pdf/2310.11511.pdf 이 논문은 자체 반성을 통해 정보를 검색하고 생성하는 새로운 프레임워크인 'Self-Reflective Retrieval-Augmented Generation (SELF-RAG)'를 소개하고 있습니다. 이 시스템은 대규모 언어 모델의 품질과 사실성을 향상시키기 위해 특별한 토큰, 즉 '반성 토큰'을 사용하여 검색 및 자체 평가를 수행합니다. SELF-RAG는 주어진 작업에 맞게 모델의 행동을 조정할 수 있도록 하여 다양한 작업 요구 사항에 맞춤화된 동작을 가능하게하며 다양한.. 2023. 12. 29.
A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 논문 리뷰 - (2) 안녕하세요 Simon 입니다. 오늘은 A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 논문 리뷰 - (2) 입니다. https://wiz-tech.tistory.com/36 A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 논문 리뷰 -(1) 개발자에게 유용한 Prompt 안녕하세요 Simon 입니다 오늘 소개해드릴 논문은 A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 라는 논문입니다. 이 논문의 배경은 반더빌트 대학에서 GPT를 사용하면서 녹아낸 프롬프트 엔 wiz-tech.tistor.. 2023. 12. 29.
WIZnet Chatbot 개발 일지 - 제품 이름 환각현상 해결하기 안녕하세요 Acorn입니다. 오늘은 WIZnet에서 서비스중인 WIZnet Chatbot의 개발 내용을 살짝 공유해 드리고자 합니다. Chatbot을 개발할 때 가장 중요시 해야되는 점은 hallucination, 환각현상 입니다. 특히 기업의 챗봇의 경우 모르는 정보를 마치 사실인 마냥 제공하는 행위는 기업의 이미지와 가치하락으로 이어질 수 있는 문제이기도 합니다. WIZnet의 경우에도 환각현상을 피해갈 수는 없습니다. 저희 회사 Chip제품 명의 경우 W5500, W5500EVB,W5100S, W6100등 이름이 유사하다는 특징이 있습니다. 이는 hallucination을 발생하기 딱 좋은 상황입니다. 환각현상이 일어나는지 GPT에게 이 세상에 없는 제품인 W6300, W6500을 물어보았습니다. .. 2023. 12. 29.
2023년에 나온 인공지능 모델들 안녕하세요 Simon 입니다. 오랜만에 글을 쓰는데요 올해도 다 끝나가고 올 한해 인공지능의 눈부신 발전과 함께 저도 이 분야에 일을 하는 사람으로써 바쁘고 정신없는 한해였지 않나 생각합니다. 올 한해를 통계를 할 겸 올 한해를 빛을 낸 모델들을 소개해드릴려고 합니다. https://journal.everypixel.com/2023-the-year-of-ai 2023: The Year of AI Explore the significant AI advancements, impactful partnerships, and legal debates that defined 2023. journal.everypixel.com 위 내용과 Reddit 에서 올 한해의 2023 AI 모델 관련된 내용이 있어서 분야별로 .. 2023. 12. 29.
올해 가장 많이 사용한 AI 도구는 챗GPT...전체 중 60% 차지 2023년은 ChatGpt의 압도적인 시장 지배의 한 해. 지난해 11월에 세상에 모습을 드러낸 '챗GPT'가 혁명을 일으켰습니다. 바로 인공지능의 세계에서 돌풍을 일으키며, 당당히 최고의 생성 AI 도구 자리에 올랐다는 건데요. CNBC의 최근 보도에 따르면, 지난 1년간 웹과 모바일 앱을 통해 무려 146억 건이라는 엄청난 방문기록을 세운 것으로 나타났습니다. 놀랍게도 이는 상위 50개 인기 AI 도구들이 기록한 총 방문횟수 240억 건의 60% 에 해당하는 수치랍니다! 여기에 월평균 방문 수만 해도 약 15억 건에 달하죠. 다른 경쟁자들의 트래픽을 모두 합친 것보다도 많은 양입니다. 이런 놀라운 성과를 이루기 위해, 라이터버디는 수천 개가 넘는 AI 도구들을 분석하며 상위 50위 안에 드는 도구들을.. 2023. 12. 27.
구글의 새로운 AI 모델 '제미나이 프로', 기대에 못 미치는 성능? 안녕하세요! 오늘은 최근 화제가 되고 있는 구글의 새로운 인공지능 모델 '제미나이 프로(Gemini Pro)'에 대한 이야기를 나눠보려 합니다. 구글이 자랑스럽게 선보인 '제미나이 프로'는, 이제 1년을 맞이한 오픈AI의 'GPT-3.5 터보'와 비교해 그 성능이 떨어진다는 소식이 전해졌어요. 이는 구글의 초기 주장과는 상반되는 결과로, 많은 이들의 주목을 받고 있습니다. 최근 벤처비트 보도에 따르면, 카네기 멜론 대학교와 스타트업 베리AI의 연구진이 진행한 외부 테스트에서, '제미나이 프로'는 GPT-3.5 터보와 비슷하거나 조금 낮은 정확도를 기록했다고 하네요. 특히, 제미나이 프로는 GPT-4와 비교할 때 더욱 뒤처지는 모습을 보였습니다. 연구진은 제미나이 프로가 특정한 답변에 편향된 경향을 보였으.. 2023. 12. 21.
A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 논문 리뷰 -(1) 개발자에게 유용한 Prompt 안녕하세요 Simon 입니다 오늘 소개해드릴 논문은 A Prompt Pattern Catalog to Enhance Prompt Engineering with ChatGPT 라는 논문입니다. 이 논문의 배경은 반더빌트 대학에서 GPT를 사용하면서 녹아낸 프롬프트 엔지니어링 팁들이 담겨있습니다. Prompt 엔지니어링에 관심이 있으신분들은 위 강의를 꼭 들어보시는 것을 추천을 드립니다. 또 수료하면 자격증이 나오니 그거에 관련해서 링크드인에 자격증을 업로드 할 수 있습니다. 이 외에도 뤼튼에서 진행하고 있는 프롬프톤 WCC 자격증 강의도 수강하시면 좋습니다. Abstrack 이 논문은 대규모 언어 모델(Large Language Models, LLMs)과의 대화에서 사용되는 프롬프트 엔지니어링 기술을 패턴.. 2023. 12. 20.
[테크포 임팩트] 커넥트데이 기술과 사회를 잇는 뜻깊은 만남 안녕하세요 Simon 입니다. 12월 19일 테크포임팩트에 다녀온 후기를 작성해봅니다. 모두의 연구소 Slack에서 무작정 신청한 이번 행사는, 기술과 사회운동가가 만나 선한 영향력을 발휘하는 프로젝트들을 공유하는 자리였습니다. 이런 오프라인 세션, 모임, 컨퍼런스는 항상 중요하다고 생각합니다. 현직자는 물론, 취업 준비생에게도 필수적인 자세라고 여겨집니다. 운 좋게 선정되어 행사에 참여했고, 사전에 구글 폼으로 개인정보를 작성했습니다. 행사에 도착하니, KAIST 학생부터 카카오 개발자까지 다양한 분야의 전문가들이 모여 있었습니다. 카카오에서 엄선한 100명의 참가자들이 함께한 이 날은, 카카오 AI 캠퍼스의 아름다운 전경과 함께 시작되었습니다. 이날은 특별하게도 카카오 김범수 의장님의 오프닝 키노트가.. 2023. 12. 20.
대규모 언어 모델(Large Language Models, LLMs)에 대한 포괄적 조사 본 내용은 아래 Medium 글을 정리하였습니다. https://cobusgreyling.medium.com/a-comprehensive-survey-of-large-language-models-llms-946a30d9288e 핵심 내용 정리 논문 발표 증가: "대규모 언어 모델"이란 제목이나 초록에 포함된 arXiv 논문의 평균 발표 수가 하루 0.40편에서 8.58편으로 증가 LLM의 원리: 대규모 언어 모델의 진보와 영향에도 불구하고, 그 기본 원리는 아직 잘 탐구되지 않음 오픈 소스 LLM의 역할: Meta의 기여는 중요하며, 오픈 소스 LLM은 확장, 맞춤화 및 성장의 촉매제 역할 LLaMA 모델 활용 연구: 많은 연구자들이 LLaMA 모델을 지시 조정(instruction tuning) 또는 .. 2023. 12. 19.
MoE : Mixture of Experts Explained 는 무엇이길래 열광인가? 안녕하세요 Simon 입니다. 이번 포스팅할 게시물은 차기 Transformers 기반의 AI 생태계를 변화시킬 수 있을지 집중이 되고있는 MoE에 대해서 알아보겠습니다. 모든 게시물은 Hugging Face 에 소개된 게시물을 토대로 작성되었습니다. https://huggingface.co/blog/moe#what-is-a-mixture-of-experts-moe Mixture of Experts Explained Mixture of Experts Explained With the release of Mixtral 8x7B (announcement, model card), a class of transformer has become the hottest topic in the open AI commun.. 2023. 12. 18.
DeepPCR : Parallelizing Sequential Operations in Neural Networks 리뷰 안녕하세요 Simon 입니다. 애플이 AI 쪽으로 많이 약하다는 평가가 항상 있는데 슬슬 시동을 거는듯 해보입니다. DeepPCR 이라고 신경망관련해서 기술 개선을 한 논문을 발표를 해서 가져와봤습니다. 애플 공식 홈페이지 머신러닝 리서처에도 올라갔습니다. Introduction 오늘날의 머신러닝과 딥러닝 연구는 복잡성이 증가함에 따라 효율적인 계산 방법에 대한 필요성이 점점 더 커지고 있습니다. 이러한 맥락에서 최근 발표된 논문 "DeepPCR: Parallelizing Sequential Operations in Neural Networks"는 주목할 만합니다. 이 논문은 신경망에서 전통적으로 순차적으로 처리되던 연산을 병렬화하는 새로운 알고리즘, DeepPCR을 제안합니다. Abstract Deep.. 2023. 12. 18.
인간의 지능을 넘은 초지능(Superintelligence) 제어: 오픈AI의 새로운 AGI 감독 방법론 공개 안녕하세요, Benjamin입니다. 오늘은 OpenAI에서 새로운 AGI(인공일반지능) 제어 방법론을 발표했다는 소식을 듣고 전해드리려고합니다. 이제 초거대 AI를 넘어 스스로 생각하는 AGI시대가 열린다는 기사를 여러번 접했었는데, 이번 연구를 통해 인간보다 뛰어난 지능을 가진 AI를 어떻게 제어할 수 있는 지에 대해 본격적으로 생각해보게 되었습니다. Open AI의 이번 발표는 기존의 AI 연구 방향과는 다른 새로운 접근 방식을 제시합니다. 간단히 말해, '약한 감독자' 즉, 저지능의 모델이 더 강력한 AI 모델을 어떻게 효과적으로 감독하고 제어할 수 있는지에 대한 연구인데요. OpenAI 연구팀은 GPT-2 수준의 모델로 GPT-4와 유사한 감독 성능을 달성했다고 합니다. 이는 비록 작은 모델이지만.. 2023. 12. 18.
Nature's 10 올해를 빛낸 10인의 과학자 중 비인간 1명 ChatGPT 2023년 12월 14일, 세계적인 과학 저널인 《자연》(Nature)은 2023년의 10대 과학 인물을 발표했다. 이 중에는 흥미롭게도 한 개의 인공지능 모델이 포함되어 있었다. 바로 OpenAI에서 개발한 대규모 언어 모델인 ChatGPT이다. 이외에도, 과학 분야에 괄목할 만한 성과를 거둔 10명의 인물이 선정되었다. 그들의 혁신적인 업적은 다음과 같다. 카르파나 카라하스티(Kalpana Kalahasti)는 인도 우주 연구 위원회(ISRO)의 "달나라 탐사선" 프로젝트의 부책임자이다. 그녀는 이 프로젝트를 통해 인도 최초로 달 표면에 착륙하는 데 성공했다. 안니 크리체르(Annie Kritcher)는 미국 국립 점화 장치(NIF)의 수석 설계자이다. 그녀는 NIF를 통해 핵융합 에너지를 실현하기 .. 2023. 12. 15.
[Langchain] 평점기반의 맛집 RAG LLM 구축하기 안녕하세요 Simon 입니다. 이번에 소개해드릴 컨텐츠는 Langchain 을 활용해서 보다 쉽게 RAG 서비스를 구축하는 방법입니다. 다들 맛집 좋아하실텐데 평점을 얼마나 믿으시는지는 모르겠습니다. 사실 구축단계에서 한국 사람들이 아무래도 네이버라는 플랫폼을 많이쓰고 신뢰하고 정보도 많기 때문에 NAVER API 를 활용하고 싶었으나, 진짜 감촉같이 이거 조금만 api 데이터쓰면 item 이다 할만한것만 지원을 하지 않는 모습이더라구요. 그래서 더욱 범용적인 Google maps 를 활용해서 만들어보았습니다. 이전에 사실 카카오톡맵기반으로 크롤링을 해서 데이터를 구축해서 만들려고 시도를 해보았으나, 자꾸 동적페이지 다음페이지 넘어가면서 Chrome Driver 가 오류가 나는 바람에 데이터를 구축하지를.. 2023. 12. 15.
구글, 'Gemini' 시연 영상 조작 논란! 구글의 계속되는 실수 안녕하세요 Acorn입니다. 최근 구글은 Gemini를 발표하면서 드디어 구글이 Openai를 따라잡나? 라는 생각이 드는 분도 계셨을 겁니다. 구글이 발표한 Gemini 시연영상인데요 한번 같이 보시죠 DALL-E를 많이 써본 분들은 더욱 직관적으로 느끼셨겠지만, 영상을 보면 Gemini에게 사진, 혹은 동영상을 보여주면 우리가 보던 ai 특유의 딱딱함이 느껴지지 않을 정도로 유연하고 다양한 답변을 하고 있습니다. 정말 사람, 혹은 그 이상의 답변을 보여주기도 하는데요 그런 Gemini의 스펙을 들고 와봤습니다. Gemini ultra 경우에는 MMLU(Massive Multitask Language Understanding)점수에 따르면 90.0%을 보여주며 GPT-4보다 우수함을 강조합니다. Gem.. 2023. 12. 14.
ReAct Prompting 에 대하여 최근 Yao et al., 2022의 연구에서 소개된 ReAct 프레임워크는 대규모언어모델의 사용 방식에 혁신을 가져왔습니다. 이 프레임워크는 추론 추적과 작업별 행동을 인터리브 방식으로 생성하여, 모델이 행동 계획을 유도, 추적, 업데이트하고 예외를 처리할 수 있게 합니다. ReAct의 핵심 개념 ReAct는 인간의 학습 및 의사 결정 과정에서 영감을 받아, "행동"과 "추론"의 시너지 효과를 모델링합니다. 이는 대규모언어모델이 외부 소스와 상호 작용하며 정보를 수집하고, 보다 신뢰할 수 있고 사실적인 응답을 생성하는 데 도움을 줍니다. ReAct의 장점 ReAct 프레임워크는 언어 및 의사 결정 작업에서 여러 최신 기술의 기준선을 능가하는 성능을 보여주었습니다. 특히, 인간의 해석 가능성과 대규모언어.. 2023. 12. 13.
전참시에 나온 ChatGPT를 사용하는 ZionT 안녕하세요 Simon 입니다. 최근 공중파 프로그램 '전지적 참견 시점'에서는 흥미로운 장면이 펼쳐졌습니다. 가수 자이언티와 인공지능 ChatGPT가 대화를 나누는 모습이 방영되었는데요, 이 대화는 단순한 질의응답을 넘어서 창의적인 상호작용의 좋은 예를 보여줍니다. 이 글에서는 자이언티와 ChatGPT의 대화를 분석하며, 인공지능이 인간의 창의성을 어떻게 촉진하고 보조할 수 있는지 탐구해보겠습니다. [#전참시] 눈 뜨자마자 꿀 떨어지는 자이언티의 아침🥰 자이언티의 "그녀"가 예상하는 올해의 MBC 연예대상 수상자는?ㅣ#자이언티 #전현무 MBC231209방송 창의적 대화의 시작 - ZionT: "부탁하고 싶은게 있어 지금 애니메이션을 제작 중인데 제목은 정요셉 나는 축구왕 나는 축구왕 슛돌이어린 시절부터 .. 2023. 12. 12.
MS "프롬프트 엔지니어링 잘하면 미세조정 필요 없어" 마이크로소프트가 인공지능 분야에서 또 한 번 큰 발걸음을 내딛었습니다. 대형언어모델들(LLM)이 특화된 의학 문제들에 대한 정교한 미세조정 없이도 업계 최고의 성능을 달성할 수 있도록 도와준답니다. 마이크로소프트에 따르면, 이 기술은 의료 분야뿐만 아니라 전기공학, 철학, 회계 등 다양한 전문 영역에 걸쳐 적용이 가능하다고 해요. 상상해보세요, 이제잠깐의 프롬프트 설정만으로도 AI가 전문가의 역량을 발휘할 수 있다니 정말 놀라운 일이죠? 여기서 더 놀라운 사실은, 메드프롬프트(Medprompt)라는 이 신기술을 'GPT-4'에 적용 했을 때, 미국 의사 면허 취득 시험인 USMLE에서 오류율이 27% 감소하며, 환상적인 90% 점수를 달성했다는 거에요. 기능적으로 뛰어났던 메드-팜(Med-Palm) 2 .. 2023. 12. 6.
ChatGPT 에게 Tip 을 주면 성능이 더 좋아진다? 안녕하세요 Simon 입니다. 이번에는 긴 글 은 아니고 팁이자 유용한 방법을 소개해드리려고 합니다. 한 트위터에서 GPT 사용자가 테스트를 해봤다고 하는데요. https://twitter.com/voooooogel/status/1730726744314069190?utm_source=www.joinsuperhuman.ai&utm_medium=referral&utm_campaign=what-happens-when-you-give-chatgpt-money X의 thebes님(@voooooogel) so a couple days ago i made a shitpost about tipping chatgpt, and someone replied "huh would this actually help perform.. 2023. 12. 6.
OpenAI의 Assistants API로 개인 수학 튜터 만들기 OpenAI는 최근 Assistants API를 출시했는데요, 이를 활용하면 다양한 상호작용이 가능한 AI Assistant를 만들 수 있습니다. 예를 들어, 오늘은 '개인 수학 튜터'라는 Assistant를 만들어 보겠습니다. 어떻게 보면 RAG 방식의 챗봇을 구현하기 위해 Open AI 가 다 만들어주고 관리하는 Tool 이라고 생각하면 될 것 입니다. Assistant API는 오마카세 이고 Langchain 은 뷔페 둘의 성격은 비슷한거 같으나 다르다. Assistant API의 구조 어시스턴트 : 큰단위 , 스레드 : 대화 내역(각각), 런 : 어떤 스탭을 결정 거치는지 런은 Assistant 인 interpreter 를 쓰지 않아도 무조건 돌아가야하는 단계다. 시작하기 전에 먼저, Assist.. 2023. 12. 5.
'챗GPT'의 혁신적인 여정, 인간만큼 똑똑해질 그날은 언제일까? 지난 1년 동안 AI의 세계에서는 온통 '챗GPT'의 혁명적인 발전이 이야기거리였죠! 마치 SF 소설에서 튀어나온 듯한 챗GPT의 성과들은 우리에게 신기함과 동시에 약간의 두려움마저 줍니다. "사람처럼 대화하는 AI"라는 말이 이제는 현실에서 실제로 일어나고 있는 일이니까요. 오픈AI가 처음으로 챗GPT를 선보인 순간부터 시작해, 지난 1년간 AI는 얼마나 진화했는지 한번 둘러볼까요? 사람만큼 똑똑해질 그날을 꿈꾸면서 말이죠. GPT-3으로 시작해 GPT-3.5가 되고, 급기야 GPT-4가 등장하며 우리들의 가상과 현실 사이를 넘나드는 일은 더 이상 불가능해 보이지 않습니다. 경이로운 것은, 챗GPT가 사회 전반에 얼마나 큰 영향을 미쳤는지입니다. 마이크로소프트가 이 기술에 수십 억 달러를 투자하는가 하.. 2023. 12. 1.
[Langchain] RAG 멀티모달을 활용한 추론 - 이력서 첨삭 튜터 안녕하세요, 여러분. 오늘은 최근에 접한 흥미로운 프로젝트, 바로 '멀티모달 이력서 첨삭 튜터'에 대해 이야기해보려 합니다. 이 프로젝트는 GPT-4 기반의 인공지능을 활용하여 이력서 작성과 첨삭을 돕는 혁신적인 시도인데요, 그 세부 내용을 한번 살펴보겠습니다. 멀티모달 이력서 첨삭 튜터의 개발 배경 이 프로젝트의 출발점은 사람들이 널리 사용하는 인공지능 이력서 서비스에 GPT-4 기반의 기능을 추가하여 더 향상된 서비스를 제공하고자 하는 아이디어였습니다. 특히, 비전 관련 기능을 첨삭하는 부분에 초점을 맞추었죠. 이는 기존의 텍스트 중심 이력서 서비스를 한 단계 끌어올리는 시도라고 할 수 있습니다. 기능 및 사용 방법 사용자는 자신의 이력서를 PDF 형식으로 업로드하고, 이력서와 관련된 질문을 입력합니.. 2023. 11. 30.
Andrew Ng prompt for ChatGPT 우리가 살고 있는 디지털 시대에 인공지능(AI)은 더 이상 먼 미래의 이야기가 아닙니다. AI는 이미 우리 일상 속에 깊숙이 자리 잡고 있으며, 그 중심에는 '언어 모델(Language Model)'이 있습니다. 이러한 언어 모델의 발전은 Andrew Ng과 같은 AI 분야의 선구자들 덕분에 가능했습니다. 특히, 최근에는 '프롬프트 엔지니어링(Prompt Engineering)'이라는 새로운 개념이 등장하며 AI의 활용 범위와 효율성을 한층 더 높이고 있습니다. 프롬프트 엔지니어링은 AI, 특히 대규모 언어 모델을 효과적으로 활용하기 위한 방법론입니다. 이는 AI에게 정확한 지시와 문맥을 제공하여, 보다 정확하고 유용한 결과를 얻어내는 기술입니다. Andrew Ng과 같은 전문가들은 이 분야에서 중요한 .. 2023. 11. 27.
728x90