본문 바로가기
728x90

ML7

[논문 리뷰] V-STaR: Training Verifiers for Self-Taught Reasoners 논문 링크 : https://arxiv.org/abs/2402.06457 V-STaR: Training Verifiers for Self-Taught Reasoners Common self-improvement approaches for large language models (LLMs), such as STaR (Zelikman et al., 2022), iteratively fine-tune LLMs on self-generated solutions to improve their problem-solving ability. However, these approaches discard the large amounts arxiv.org 기존 LLM들의 Self-Taught 방법론들은 스스로 생성한 해결책.. 2024. 2. 14.
AI 취업 시장의 변화 최근 AI 취업 시장의 변화에 대해서 유럽의 한 NLP 연구자가 쓴 글을 보고 블로그에 유입되는 분들에게도 도움이 될만할 것 같아서 소개해드리려고합니다. 이 글에서는, 지난 5년 동안 AI와 NLP 분야의 발전이 매우 빠르게 진행되었으며, 박사학위를 마친 후에 NLP 관련 취업 시장의 분야가 훨씬 더 다양해졌다고합니다. 아마 BERT, GPT와 같은 다양한 모델이 생긴 영향이 크며, 과거에는 ML 등과 같은 기초 연구에 집중되었다면 이제는 점차 실용적인 연구로 옮겨가고 있다고 합니다. 그로인해 PhD. 박사학위에 대한 대안으로 스타트업에서의 경험을 통해 실제 문제 해결 위주의 경력을 쌓는 것을 대안으로 볼 수 있다고 말하고 있습니다. 여기서 소개하는 5가지 AI 취업시장 트랜드는 다음과 같습니다. 1. .. 2024. 2. 13.
나만의 챗봇 Service해보기(1) - 결과부터 보자. 안녕하세요 Acorn입니다. 최근에 저는 기술의 발전에 매료되어 있습니다. 특히 LLM 분야에서의 급속한 진보가 놀라울 따름인데요. 이번 프로젝트는 LLM, 특히 RAG를 통한 CustomChatbot 제작을 위한 공부를 하고, Streamlit을 통해 서비스화를 시켜보았습니다. Streamlit은 데이터 사이언스와 머신 러닝을 위한 빠르고 사용하기 쉬운 앱 프레임워크입니다. Python 기반으로 작동하기 때문에, 저와 같은 개발자들에게 친숙한 환경에서 작업할 수 있었습니다. Langchain은 최신의 언어 모델을 사용하여 다양한 언어 작업을 수행할 수 있는 라이브러리입니다. 이 두 도구를 결합하여, 쉽고 빠르게 서비스화할 수 있는 챗봇 프로젝트를 제작하였습니다. 아래 사이트는 제가 제작한 챗봇 사이트입.. 2024. 1. 18.
Apple 의 M 시리즈를 활용한 딥러닝 freamework 인 MLX 에 대해 알아보자 - (1) 설치 안녕하세요 Simon 입니다. 제 올해의 목표인 Apple ML 생태계를 공부해보자 였는데요. 애플에서 최근에 출시한 MLX에 대해 포스팅 해보겠습니다. MLX는 Apple 실리콘에서 효율적이고 유연한 머신 러닝을 위해 설계된 NumPy와 유사한 배열 프레임워크로, Apple 머신 러닝 연구팀에서 개발했습니다. Python API는 몇 가지 예외를 제외하고는 NumPy를 거의 그대로 따릅니다. MLX는 또한 완전한 기능을 갖춘 C++ API를 갖추고 있으며, 이는 Python API와 매우 유사합니다. 컴포저블 함수 변환: MLX는 자동 미분, 자동 벡터화, 계산 그래프 최적화를 위한 구성 가능한 함수 변환을 제공합니다. 지연 계산: MLX의 계산은 지연 계산입니다. 배열은 필요할 때만 구체화됩니다. 멀.. 2024. 1. 8.
오픈리더보드의 평가지표에 대해 안녕하세요 Simon 입니다. 오늘은 Open LLM Leaderboard 에서 순위를 평가하는 지표에 대해서 자세히 알아보겠습니다. https://huggingface.co/spaces/HuggingFaceH4/open_llm_leaderboard Open LLM Leaderboard - a Hugging Face Space by HuggingFaceH4 huggingface.co 평가방식(Im-evaluation-harness) - 질문과 보기를 모델에 입력을 합니다. - 각 보기를 생성할 확률을 통해 예측을 수행합니다. - In-context Learning 을 위해 예제를 함께 삽입합니다. 질문 : 인구가 제일 많은 나라는? 보기 : (1) 중국 (2) 한국 (3) 미국 (4) 일본 [모델의 추론.. 2024. 1. 4.
[Langchain] 평점기반의 맛집 RAG LLM 구축하기 안녕하세요 Simon 입니다. 이번에 소개해드릴 컨텐츠는 Langchain 을 활용해서 보다 쉽게 RAG 서비스를 구축하는 방법입니다. 다들 맛집 좋아하실텐데 평점을 얼마나 믿으시는지는 모르겠습니다. 사실 구축단계에서 한국 사람들이 아무래도 네이버라는 플랫폼을 많이쓰고 신뢰하고 정보도 많기 때문에 NAVER API 를 활용하고 싶었으나, 진짜 감촉같이 이거 조금만 api 데이터쓰면 item 이다 할만한것만 지원을 하지 않는 모습이더라구요. 그래서 더욱 범용적인 Google maps 를 활용해서 만들어보았습니다. 이전에 사실 카카오톡맵기반으로 크롤링을 해서 데이터를 구축해서 만들려고 시도를 해보았으나, 자꾸 동적페이지 다음페이지 넘어가면서 Chrome Driver 가 오류가 나는 바람에 데이터를 구축하지를.. 2023. 12. 15.
내가 좋아하는 가수로 음원 변환하기 TTS 기술 review 안녕하세요. Simon 입니다. 일교차가 많이 쌀쌀해지고 있습니다. 다들 환절기에 감기 조심하시고 집에서 따끈한~ GPU와 함께 딥러닝 한잔은 어떠실까요? 첫 포스팅을 쓰게 되는데 앞으로 재밌는 기술 , 저희 회사에서 하는 Contents 제작 관련된 글들을 포스팅 해보려고 합니다. 저는 AI 엔지니어이기 때문에 다른 논문리뷰, 오픈소스 관련 세미나 글도 써볼 예정입니다. https://github.com/jh941213 오늘은 AI 기술을 활용하여 음악의 보컬을 합성하고 음악을 제작하는 방법에 대해 소개하려고 합니다. 최근에는 AI 기술이 음악 분야에서도 큰 주목을 받고 있습니다. 그 중에서도 TTS(Tex-to-Speech) 기술은 특히 눈에 띄는 발전을 보이고 있습니다. 1. 시작하기 전에 필요한 .. 2023. 11. 2.
728x90