Grok3. o1 pro 와 비교해서는 여전히 아쉬운 부분이 많이 있다고.
X의 Bopyo Park님(@AIBopyo)
그록3 후기, 글쓰기에서는 어떨까? 나는 주로 글쓰기에 사용하기에 글쓰기에서 비교 o1 pro vs grok3 예시 상황 '56분정도 되는 오디오 자막파일을 회의록으로 작성하는 것' 1. 일시에 대한 부분 (그록3의 거짓말) 첨부한 이미지를 보면…
구글에서 작년말에 제미나이 2.0 플래시 싱킹. 모델이 발표되었죠. 너무 연말이라 별로 신경안쓰고 '아 추론모델 나왔네?' 정도로 넘어갔는데요. 게다가 Flash 라 o1-mini 와 비교될 정도의 모델이겠거니 했는데.. 실제 Performance 에서는 o1 을 뛰어넘으면서도 속도 까지 겁나 빠름니다! 아니 진짜 구글... 이정도 모델을 내놓아도 화제를 전혀 못 얻네요.. (그마저도 빠르게 2025-01-21 또 최신 업데이트한 모델을 내놓았음에도..) 지금 화제인 딥시크 이상이라길래 비교해보며 써봐도, 물론 어느모델이나 장단점이 있고 결과 만족도야 상황에 따라 딥시크가 나은것도 같지만 속도면에서 너무 빨라서.. 저는 제미나이가 더 만족스럽네요? 언능 본 Gemini 모델에 접목되었으면... (현재는 AI Studio 에서만 제공중 + 그라운딩도 불가능해서 외부 데이터 활용도 불가..)
Gemini 2.0 Flash Thinking: Evaluating Google’s Version Against ChatGPT-o1
Explore a comprehensive comparison between Google’s newly released Gemini 2.0 Flash Thinking and OpenAI’s ChatGPT-o1 Preview.
OpenAI 에서 공개한 o1 모델 시연 영상을 하나로.
OpenAI o1 모델 공개와 함께 코딩 데모를 위해 올라온 간단한 게임을 만드는 사례. 게임 매우 간단하면서도 재밌어 보입니다 ㅋㅋ 이제 이걸 랩핑해서 앱스토어에 올리면 나도 인디게임 메이커가 되는건가요.? 그나저나 이 과정에서 실제 코드를 실행하는 것은 결국 직접 내 console 에서 해야 한다는게 아쉽기도.. 이정도 게임 Anthropic 아티팩트 기능을 통해 그냥 바로 실행도 되던데.. OpenAI 쪽은 UX 환경 측면에서 신경을 덜 쓰는듯도. 어차피 코딩 결과는 IDE 에서 통합되어 쓰이는 경우가 많으니 굳이 웹UX에 투자할 필요가 없다는 판단일 수도 있구요.
얼마나 대단할려나~! 잠깐 써보니 대답 과정 중 "생각중...." 으로 시간이 꽤 오래 걸린다는 것 외에 대부분의 상황에선 기존 모델과 크게 다른 결과는 아닌거 같긴 한데... OpenAI 에서 이번 모델과 함께 선보이는 사례들을 보니 일반적인 질문보다는 좀 더 깊히 파고들어가야 하는 전문적인 영역, 절차적인 생각을 필요로 하는 부분에서 특히 강점이 있는 모델인 것 같습니다.

수학올림피아드서 GPT-4o 제쳤다…오픈AI, 추론 뛰어난 새로운 모델 'o1' 출시
오픈AI가 추론 능력에 초점을 맞춘 인공지능(AI) 모델 'o1(오원)'과 'o1-미니(mini)를 출시했다. 이전 모델보다 과학·코딩·수학 등 분야에서 더 어려운 문제를 해결할 수 있다는 것이 특징이다. 오픈AI는 12일(현지시간) 공식 블로그…
새롭게 2024.09.12 OpenAI 에서 새롭게 추론이 가능한 LLM 모델 o1 을 출시. 현재는 프리뷰 (preview) 상태 로 OpenAI 유료 구독 한 유저에게만 순차적으로 제공된다고 합니다. o1 출시와 함께 공개된 OpenAI 영상 중 한국어 “직우상 얻떤 변역깃돋 일끌 슈 없쥐많....”과 같은 이상한 글자 해석시키기 영상이 있는데요. 기본적으로 GPT-4o 모델은 이러한 이상한 글자들을 이해할 수 없지만 o1 은 추론과정을 통해 절차적으로 Thnking.... 과정을 거쳐서 이를 해낼 수 있다고 합니다. 이에 대해 o1 개발한 연구원 중 한국인이신 정형원님 ( https://hwchung27.github.io/) 이 소개해주셨어요.