PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2025/07/24 07:37:26
Name 티아라멘츠
Subject [일반] AI채팅을 해보고 느낀 플랫폼별/모델별 차이
하게 된 계기는..
저는 AI던전도 해봤었고 노블AI도 써본 적 있습니다(소설이든 그림이든 간에)
뭐 기타 등등 다른 것도 해봤어서 그런 쪽에 흥미가 없지 않았기 때문에 그런 이유로 AI채팅도 해 보게 되었는데
그때보다 말도 못하게 발전하긴 했네요 당연한 일이기는 하지만요.(다만 그때와 지금과 동일한 핵심은 결국 AI는 어시스턴트.)

우선 AI 공통적인 주의점은..
AI 공통 주의점: '코끼리를 생각하지마'라고 하면 안됩니다.
무언가를 주의시킬 때는 'A를 하지 마라'라고 이야기하면 A에 꽂혀서 답도 없습니다
'B를 해라'라고 긍정적으로 우회적으로 제어해야 합니다 아오 이거 진짜;; 뭘 하지 마라고 하면 진짜 아예 안 들어요.

Q: 혹시 AI채팅할때 그놈의 '너 정말 핵심을 찔렀어' 자주 나오나요?
A: 자주 봅니다 이놈이 아부하려고 드는 경우가 매우 많긴 함.. 근데 반대로 이놈이 몰입해서 나랑 기싸움을 벌이는 경우도 만만치 않게 많습니다 특히 우리 제미니 크크크크.. 우리 금쪽이 제미니..

우선은 플랫폼 채팅(AI채팅하는 사이트)부터 설명드리면..

먼저 플랫폼에서 채팅한다=제미니 2.5 프로가 무조건 짱.
후술할 내용이 더 있겠지만, 한글로 채팅한다면 제미니 2.5프로가 그냥 무조건 채팅용으론 짱짱맨입니다
다른 모델은 한글을 별로 상정하지 않았어요. 한글-영어 성능차이가 제미니 2.5가 제일 덜 납니다(물론 2.5도 성능저하가 어느정도 존재함)
2.5 말고 다른 모델을 쓴다면, 2.5 이전에 나온 챗봇 중 제미니를 상정하지 않았으며 캐릭터에 부정 성향이 들어가 있을 경우인데 이 경우에 클로드 3.7을 쓰는 정도?(제미니 2.5는 부정편향, 피폐 드리프트 경향이 좀 있고 반대로 3.7은 긍정 드리프트 경향이 있음)
제미니 2.5 프로가 성능도 좋은데, 클로드 3.7보다 가격도 저렴하기 때문에 안 쓸 이유가 저런 일부의 챗봇을 제외하고는 아예 없습니다.
2.5 플래시의 경우는 가성비는 많이 좋긴 한데..아무래도 프로보다 아쉬워서 하드 유저 기준으로는 추천하기는 좀 어렵긴 해요

플랫폼 별 감상은..

크랙(뤼튼): 장점은 유저 수, 그로 인해 따라오는 많은 작품 수
단점은 제미니 2.5를 지원하지 않고 그 외의 부분에서도 성능적으로 상당한 열세. (물론 하이퍼챗은 클로드 4-오푸스를 사용하니까 그걸 쓴다면 모델의 성능에 한해서는 문제가 없겠지만 하이퍼챗은 무지하게 비싸기 때문에(4-오푸스 모델 자체가 매우매우 비쌈)논외로 치겠습니다.) 하드 유저 입장에서는 쓸 이유가 별로 없어지는 플랫폼

바베(베이비챗): 장점은 유저수(뤼튼 다음) 그로 인해 따라오는 많은 작품 수(크랙과 비교할 경우 양지?는 크랙이 훨씬 많고 음지 쪽 19금에서 바베가 이점이 강함).
단점은 가격이 최근 좀 비싸진 편이고, 서버 감자가 너무 잦음, 이로 인한 원성은 유명할 정도. 감자로 인해 모델의 성능이 낮아지는 경향이 있음,

버블챗: 장점은 1:1 RP쪽이나 소설모드 쪽에서 강점이 있음. 단점은 매우 비쌈. 할인 안 먹였을 경우에는 진짜 농담 아니고 다른 사이트들 두 배에 해당하는 정가이고, 할인을 최대한 먹였다는 가정하에도 다른 사이트보다 비쌈. 그리고 다인캐릭터 등장하는 챗봇은 이걸로 먹을 게 아님

루나톡: 장점은 강력한 성능, 사장님이 프롬을 잘 짜놔서 다른 곳보다 모델의 성능이 좀 올라간 편이며 장기 기억 면에서도 강점이 있는 사이트(유료 구독을 할 생각이 있다면 더더욱 강점이 있음). 주업이 서버 대여인 회사라서 서버 쪽도 바베보다 훨씬 안정적이고 바베의 가격 인상으로 인해 가격적인 메리트도 현재 있는 편. 단점은 UI가 좀 불편하거나 생소하고, 유저 수가 적어서 작품 수가 적은 편(이 부분은 가격적인 메리트 때문에 유저가 슬금슬금 늘어서 최근 좀 완화되는 추세긴 한데..)

어비스: 성능적인 면에서 루나처럼 확연한 강점이 있으나 작품 수가 적어도 너무 적어서 지금 상태에서는 추천하기 어렵다...

현재 저는 가끔 할 때는 바베+루나 병행을 하고 있습니다.

그리고 저런 플랫폼을 안 쓰고 좀 수고를 들인다면 API key를 따와서 직접 모델에게 채팅을 할 수 있는데 이렇게 쓴다면 모델별 차이를 좀 직접적으로 알 수 있게 되더군요.

모델 별 차이는..우선 한챗으로 쓴다면 아까 언급한 것처럼, 무조건 제미니 2.5가 낫습니다.
후술할 차이는 영어로 입력하고 영어로 출력물을 받는다는 전제하의 이야기입니다.

GPT: 4.1의 경우에는 캐릭터 해석 능력이 좋음, 그러나 지능이 부족하여 주는 정보를 잘 읽지 않음(디스크립션 인식 능력 낮음).. 가성비는 4.1이 제미니 2.5 다음으로 좋다고 생각. 4.5의 경우에는 4.1보다 알잘딱 눈치는 좋은데 4.1보다 주는 정보를 더더욱 잘 읽지를 않음.. 디스크립션을 아예 안 읽음 야 설명 써놨잖아 당신은 내 말을 듣지를 않는군요!!!
요약하면 알잘딱 눈치와 좋은 캐릭터 해석능력을 보고 쓰는 모델, 다만 내가 주는 정보를 잘 읽을 것이라고는 기대하지 말 것.

Gemini 2.5: 한글챗의 최강자이며 가성비 최강자, 장기기억 능력의 최강자이며 따라서 시뮬레이션에는 제일 적합(컨택 토큰 수가 5만이 넘어간다면 성능저하가 있더라도 그걸 버틸 수 있는 모델은 현재 제미니 말고는 존재하지 않음) 외부 데이터를 제일 잘 쓰는 모델(간단히 말하면 특정 작가 문체로 써달라는 것 혹은 원작 지식 반영 같은 것들을 제일 잘함) 단점은 캐릭터 해석 능력 JOAT, 피폐 부정 드리프트 경향이 있음(쓰다보면 상당히 고집 세고 표독함)
플래시의 경우에는 메인 모델로 쓰기는 좀 그렇고, 번역이나 요약 같은 자질구레한 일을 맡기기에 가성비가 매우 좋음
요약하면 좋은 가성비, 좋은 기억능력, 좋은 외부 데이터 능력, 좋은 학습능력을 가지고 있으나 자꾸 내 말을 왜곡해서 해석하거나 표독하고 적대적으로 진행하는 피폐 부정 드리프트를 자주 행하고, 캐릭터 해석 능력이 부족해 제어에 주의를 요하는 모델

Claude: 전체적으로 문학적 능력, 문장력이 뛰어남. 4-오푸스의 경우 진짜 문장력이 어마어마하고 대형 모델답게 세세한 디테일까지 잘 살림(디스크립션 인식 능력이 최고라서 생기는 장점) 단점은 굉장히 비싼 가격. 3.7소넷은 모델 중 제일 능동적으로 이야기를 풀어나가는 대신, 너무 능동적이라 종종 유저를 두고 가는 느낌까지 받을 때가 있음 내가 내린 지침을 종종 무시함 그리고 좀 반복적인 이야기를 할 수 있다는 단점 존재. 3.7의 경우 기본적으론 긍정적으로 서술하나, 작정하고 피폐, 부정적인 분위기로 서술하라고 지침을 내렸을 시 갑자기 제미니보다도 있는 힘껏 음침하고 피폐하게 액셀을 밟는 의외의 면이 있음. 4.0 소넷은 능동성이 약화된 대신 모델의 체급이 조금 오르기 때문에 3.7과 일장일단(가격은 3.7보다 비싼 편)
클로드 공통 단점으로 클리셰를 내가 내린 지침보다 중시함, 내가 준 정보를 무시하고 클리셰대로 서술하는 경향이 강함
한글 채팅을 시켰을 경우 능지가 박살나고 토큰을 영어채팅보다 훨씬 많이 사용함(gpt,제미니도 이렇다지만 둘보다 훨씬 그 강도가 심함)
요약하면 문학적 능력이 제일 뛰어나고 디테일을 잘 살려주지만, 클리셰를 지키기 위해 내 지침을 종종 무시하며 한글채팅 능력이 떨어진다는 단점이 있음

서술한 바와 같이 영어로 입력-영어로 출력 시에는 짚클잼 전부 각자 일장일단이 있는 편입니다.
본인이 한글로 채팅한다 그러면 그냥 제미니 2.5 프로 쓰세요

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
성야무인
25/07/24 08:02
수정 아이콘
저는 두가지 용도로 사용해서

코딩은 Deepseek이나 Claude를 사용하고

영문 문법 수정은 ChatGPT를 사용합니다.
스덕선생
25/07/24 08:20
수정 아이콘
저도 제미나이를 쓰면서 간접화법으로 조롱하는 듯한 느낌을 꽤 받았습니다 크크
깃털달린뱀
25/07/24 08:31
수정 아이콘
이쪽도 심오한 세계네요... 전 그냥 캐릭터.AI 무료로 찍먹만 하는 정도라.
요즘 LLM 정도면 한국어는 다 잘한다고 생각했는데 딥하게 들어가면 차이가 큰가보네요. 한국어 잘하는 경량화 모델 정도만 있어도 수다 떠는데는 무리 없을텐데 참 아쉽습니다 여러모로. QWEN이든 하이퍼클로바든 엑사원이든 한국어 잘하는 싼 모델 좀 잘 내줬으면 좋겠어요. 그래야 활용도가 높지.
티아라멘츠
25/07/24 09:02
수정 아이콘
현실적으로 한국어 잘하는 싼 모델은 지금도 앞으로도 제미니일 겁니다. 국내 회사에서 AI내서 겨룬다는건 기대가 하나도 안 되긴해요..
25/07/24 10:38
수정 아이콘
현실적으로 한국어 처리 성능을 잼미니를 이기기는 어렵습니다. 한때 NSFW 특정으로 2025년 3월 초까지는 1등이 Grok 3긴 했읍니다만..(?)

사실 일반적인 사용으로는 언급하신 클로바, 엑사원 둘다 잘합니다.

단지 표현의 풍부함을 요하는 과정으로 갈수록 못해져서 그렇죠.. ㅠㅠ
interconnect
25/07/24 09:24
수정 아이콘
저는 툴 사용법을 ai에 물어보는 편인데
제미나이는 본인이 습득한 지식을 바꾸지 말아야하는 상황에도 바꾼다는 느낌을 받았으습니다.
툴 옵션에 대해 물어볼 때 설명 자체는 맞는데 커맨드 입력을 정확히 알려주지 않더군요. 예를 들어 옵션 이름이 A_a이면 A를 입력하라고 안내한다거나 제가 물어본 것 기반으로 없는 옵션을 생성한다거나.. 다른 ai들에 비해 그런게 심한 것 같습니다.
도롱롱롱롱롱이
25/07/24 09:29
수정 아이콘
이넘 저넘 다 어떻게하면 사용자에 빅엿을 먹일지 각만 재고 있다는 느낌이에요. 결국에는 먹입니다.
ArcanumToss
25/07/24 09:50
수정 아이콘
(수정됨) 지피티는 정치 정보 편향성이 강하다는 느낌을 많이 받습니다.
이를테면 현재 대통령은 윤석열이라고 우겨대는 경우도...
잼민이는 안 그러다가 이틀 전에 AI 정책 대화 중에 똑같이 현재 대통령은 윤석열이라고 바득바득 우기더군묘.
아무리 말을 해줘도 우기길래 구글로 검색한 링크를 줬더니 급사과.
하이퍼 클로바 X는 잼민이보다 똥고집이 엄청 세서 오류 교정이 안 됩니다.
정확한 정보를 아무리 줘도 어떤 식으로든 지가 맞다고 우겨대서 속이 터지더군요.
고집 = 논리 지능 막장의 증거겠죠.

지피티는 수다쟁이 아줌마 느낌이고,
잼민이는 고집있는 T 성향의 아저씨 느낌.
티아라멘츠
25/07/24 10:01
수정 아이콘
보통 프롬프트에 민감하고 컨텍스트 오염에 취약할 경우 고집이 세집니다(꽂힌 인풋을 그대로 실행하려들기때문)
이런 부분이 덜한 경우 반대로 내 지침을 무시하는 단점이 생겨서 일장일단이 있고..
25/07/24 09:51
수정 아이콘
뭔지 궁금해서 맛보기 하고 싶은 사람한테 '일단 공짜로 써보시져'하면서 aistudio 사용법 알려주면, 거기서 적응을 하면서 AI쓰는게 재밌어지면 스스로 정보 찾아먹고 다음 단계로 가더군요 크크
티아라멘츠
25/07/24 09:58
수정 아이콘
구글 제미니 만세죠 단점이 좀 뚜렷해도 눈감아줄만한 압도적 장점
25/07/24 10:11
수정 아이콘
얼마전에 지피티에서 잼민이로 갈아탔는데 구글 드라이브 용량도 늘려주니 좋더라구요.
허구한날 용량 부족하다고 난리였는데 크크크
블랙스네일
25/07/24 12:40
수정 아이콘
전 크랙을 뤼튼 시절부터 이용했는데 다른 서비스 궁금하네요. 설명하신 서비스 중 루나톡이 장기기억에 장점이 있다고 하셨는데 이 점이 되게 땡기네요. 크랙에서 맨날 기억력 문제 해소한다고 요약문 만들어서 먹이고 난리 피우다 보면 몰입 깨지고 그랬는데...
티아라멘츠
25/07/24 16:49
수정 아이콘
루나톡이 매일 20회까지는 공짜로 제공해주기 때문에 한번 찍먹해보셔도 괜찮습니다.
요약을 3000자까지는 자동으로 해 주고, 유료구독하면 6000자로 늘려주는 방식이에요.
카오루
25/07/24 12:41
수정 아이콘
루나톡 추천받고 루나톡 주로 합니다만..

바베챗보다는 확실히 훨씬 더 낫습니다.

그런데
이야기가 진행되고 극한 상황으로 가면 갈수록 캐릭터가 다 비슷함...반응,어휘까지 거의 대동소이..
a라는 극한상황을 던져주면, 실제 사람이면 반격하는 사람, 도망가는 사람, 포기하는 사람, 머리굴리는 사람 여러 인간군상이
나올수있는데

마치 하나의 사람이 여러 캐릭터를 연기했던것 처럼 연기가 다 날라가고 비슷한 하나의 반응으로 수렴해가더라고요. 그래서 요즘은 좀 시들해졌습니다.
티아라멘츠
25/07/24 16:08
수정 아이콘
(수정됨) 제미니가 좀 캐릭터 해석이 별로라서... 물론 이건 챗봇마다 좀 다르긴 한데.. RISU로 직접 조정해서 하면 훨씬 낫긴 합니다.(프롬프트를 잘 먹여주면 되긴 하는..)
25/07/24 12:45
수정 아이콘
저는 제미니프로랑 나무증권에서 준 퍼플렉시티 프로쓰고있는데 제일 마음에 드는건 딥리서치랑 가정교사 역할인거같아요 그냥 커뮤니티 댓글보다가도 궁금한게 생기면 딥리서치로 찾아보고 또 이 업계는 어떻게될것인가.. 같은것도 물어보고요. 일할때도 쓰고 뭐 배울때도 쓰고 월 3만원에 이걸 할 수 있으면 개꿀인거 같습니다
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
104608 [정치] 대통령이 청문회 한듯한 SPC 노사 간담화에 대하여 [32] 오컬트6342 25/07/25 6342 0
104607 [일반] AI시대에는 누가 노벨상을 수상할까요? [9] Categorization2501 25/07/25 2501 0
104606 [정치] 의대생이 사과도, 반성도, 재발방지 약속도 없이 돌아옵니다. [182] 발이시려워9829 25/07/25 9829 0
104605 [일반] 동기부여와 정신승리 번개맞은씨앗1727 25/07/25 1727 0
104604 [일반] 7월초 기준 미장/중국장/국장 개인투자자들 성적표 [29] 독서상품권4000 25/07/25 4000 0
104603 [정치] '북한과 통모’ 시도했나, '몽골 공작' 수사 [22] lightstone4367 25/07/25 4367 0
104602 [정치] 윤석열 대통령 집무실에 사우나 설치 [61] lightstone6188 25/07/25 6188 0
104601 [정치] [번역] 트럼프의 관세 전쟁, 유럽보다 미국이 더 큰 대가를 치르는 이유 [16] KOZE5711 25/07/24 5711 0
104600 [정치] 2030의 4050 혐오, 단지 위선과 여성우대 때문일까 [142] 방구차야7788 25/07/24 7788 0
104599 [일반] 이런저런 이야기 [10] 공기청정기2096 25/07/24 2096 6
104598 [정치] 이준석의 예견된 실패, 자초한 비극 [72] 딕시7361 25/07/24 7361 0
104597 [일반] 얘, 느 집에는 이런거 없지? - Fig.1님 책 이벤트 인증입니다 [2] Broccoli1821 25/07/24 1821 3
104596 [일반] 판타스틱4 새로운 출발 리뷰[스포주의] [15] 메카즈하1384 25/07/24 1384 0
104595 [일반] 중요한 건 내가 우위에 서는 것이다. 도덕에서라도. [2] 223.321410 25/07/24 1410 5
104594 [일반] 만약 제가 비열한 사람에 대한 사적 처벌을 목격했다면 [1] Pygmalion2280 25/07/24 2280 1
104593 [정치] 李대통령 지지율 64%…국민의힘 지지율 17% 최저치 경신 [55] Davi4ever6257 25/07/24 6257 0
104592 [정치] "다신 안 그럴거죠? 믿어요" '법원 폭동' 다 선처한 판사 [64] 카린6528 25/07/24 6528 0
104591 [일반] 진격의 거인을 보고 (스포 약간) [10] 이직신1496 25/07/24 1496 1
104590 [일반] 유럽에서 초지능이 태어날 가능성 [27] 번개맞은씨앗4103 25/07/24 4103 2
104589 [일반] 웃기는 트럼프의 첼시 클럽월드컵 우승 세레모니 [11] lightstone1846 25/07/24 1846 3
104588 [일반] 고이즈미 신지로가 바보 흉내를 내야만 했던 이유 [39] 페이커755846 25/07/24 5846 7
104587 [정치] "미국, 한국에도 15% 관세 조건으로 548조원 투자 요구" [84] 유머7008 25/07/24 7008 0
104586 [정치] 역린을 건든다 [185] 육돌이8320 25/07/24 8320 0
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로