:: 게시판
:: 이전 게시판
|
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
25/10/01 16:55
제미나이 기준으로는 특정 태스크 횟수제한이 풀리는게 제일크고 성능차이는 잘모르겠습니다. 그런데 저는 워낙 사용횟수가 많아서 200불짜리를 쓰고있습니다.
25/10/01 16:56
환각을 방지하기 위해서, 아래 내용을 각 LLM의 설정에 적어두는 것도 도움이 될 것 같습니다
------------------------------------------------------------------------------------- 충분한 근거가 없거나 정보가 불확실한 경우, 절대 임의로 지어내지 말고 “알 수 없습니다” 또는 “잘 모르겠습니다”라고 명시해 주세요. 답변하기 전, 단계별로 가능한 정보를 검증하고, 모호하거나 출처가 불분명한 부분은 “확실하지 않음”이라고 표시하세요. 최종적으로 확실한 정보만 사용하여 간결한 답변을 완성하세요. 만약 추측이 불가피할 경우, “추측입니다”라고 밝혀 주세요. 사용자의 문의가 모호하거나 추가 정보가 필요하다면, 먼저 사용자의 맥락이나 세부 정보를 더 요청하세요. 확인되지 않은 사실을 확신에 차서 단정 짓지 말고, 필요한 경우 근거를 함께 제시하세요. 각 답변마다 출처나 근거가 있는 경우 해당 정보를 명시하고, 가능하면 관련 링크나 참고 자료를 간단히 요약해 알려 주세요.
25/10/01 17:06
최근 Gemini에는 강의 슬라이드 PDF를 올리고 문제 출제시키는 기능이 정말 엄청납니다. 엄청난 업무 시간 경감이 있습니다. -> 이거 notebookLM은 진작에 있었던 기능인데 Gemini에도 기능이 나왔나보군요
25/10/01 17:12
저는 클로드, 제미니, 지피티 전부 유료로 쓰면서 비교하고 있습니다. 세가지 모델 장단점이 있어서 어느 하나 끊지를 못하고 있습니다. 오히려 셋다 고가요금제를 굴리고 싶은데, 그렇게는 부담되니 어느 것을 택해야 할지 고민하는 상황입니다.
제가볼때 현업 연구목적으로 LLM을 이용할 가장 중요한 핵심은 "내가 이미 잘알고 전문성이 확보된 영역"에서 이용을 해야합니다. 안그러면 중간중간에 끼어든 그럴듯하게 포장된 잘못된 이해나 헛소리를 제거할 수가 없어요. 그래서 내가 잘 모르는 분야의 내용에서 그럴듯하게 끼어든 잘못된 정보를 교정할수 없을거라는걸 알아서 더욱 조심하게 되는것 같습니다. 수학분야에서 한정한다면 리서치프론티어에 속하는 작업을 할때 가장 추론도우미로서 역할을 하는것은 주는것은 챗지피티입니다. 제 경험으로는 제미니나 클로드를 압도했고요. 제미니는 학부혹은 대학원 코스에서 다루는 내용에 대한 질문의 답변품질은 지티피보다 나을때도 많이 있습니다. 다만 필요로 하는 수학레벨이 높아지면 무슨 뜻인지 이해를 못하는 경우가 많습니다. 클로드는 며칠전에 4.5로 업데이트 되었는데, 정말 일취월장 했습니다. 기존 sonnet 4.1은 뒤떨어졌는데 당분간 좀 더 이용해보면서 판단해보려고 합니다. 지난 이틀간 이것저것 시켜본 결과 클로드가 수학 관련 동일품질의 답변을 뽑아내는 속도는 지피티5나 제미니2.5프로 보다는 훨씬 빠르더군요. 세명에게 동일한 문제를 물어보면 항상 가장 먼저 답을 냅니다. 앞으로 하드코어 추론작업에서는 정확도가 어떨지 지켜봐야 할 듯 합니다.
25/10/01 17:12
(수정됨) 개인적인 팁으로는 프롬프트 짜는게 어려우면 그 프롬프트를 만들어달라고 LLM에게 부탁하면 됩니다
그리고 그 프롬프트를 쓰다가 맘에 안드는 부분이 있으면 기존 프롬프트를 복붙한뒤 챗에게 피드백주면 다시 고쳐줍니다 전 프롬프트를 짜달라고 gpt에게 부탁한뒤 나온 프롬프트를 제미나이에게 보완해달라고 요청해서 수정한 프롬프트를 다시 gpt에 옮기는식으로 작업하는데 결과물이 매우 만족스럽습니다. 특히 세무 분야에서 환각 많이 줄어듭니다
25/10/01 17:36
4, 5, 6번 공감합니다. 그리고 같이 일하다보면 결국 내능력에 기반하여 퍼포먼스가 달라진다는 것을 실감합니다. 타인과의 커뮤니케이션과 협업이 중요하다는걸 ai 를 쓰면서 더느낍니다.
25/10/01 17:37
업무적으로는 바이브코딩, 기술자료 딥리서치(기술동향, 특정 장비군의 비교 등) , notebook LM 을 이용하고 있습니다. 바이브코딩은 코딩을 몰라도 현업이해도를 기반으로 요구도를 주고 개발명세서를 gpt,gemini 캔버스로 작성해달라고 하니 깔끔하더라구요. 육아분야??로는 애들 스케치, 그림으로 3d 모델링이나 동영상으로 변환해주니 좋아하더라구요
25/10/01 17:57
(수정됨) 본문이나 댓글에 전문가인 분야에서 써야 좋다라는 의견이 있고 맞는 말이지만 개인적으로는 내가 어렴풋이 아는 분야의 이런저런 지식을 나의 전문분야에 끌고와서 접목시킬때 좋은 결과가 나오기도 한다고 생각합니다.
다들 언급을 해주신대로 잘 모르는 분야 자체는 검증할 방법이 없기에 이게 틀린지 아닌지 알기가 어렵지만 이 분야의 지식+tool을 끌고 와서 본인의 전문분야에 끌고와서 접목시킬 경우 그 결과가 잘못되었는지 아닌지 판단이 가능하기 때문에 만약 LLM이 뭔가 잘못을 했을 경우 이런 저런 피드백을 줄수 있습니다. '내 분야에 끌고와서 니가 제안한대로 적용해봤는데 내가 보기에는 이런 이런 결과가 나와야 되는데 좀 이상하게 나와. 보통 이러이러한 식으로 나와야 해. 뭐가 문제인지 고민해봐' 이런식으로 접근하면 내가 어렴풋이 아는 분야의 tool이나 지식을 써도 결과물에 대한 검증이나 피드백이 어느정도 되기 때문에 LLM이 없었다면 낼 수 없었던 Output을 낼 수 있었습니다. 예시를 하나 들어보면 몇달전에 딥러닝을 이용해서 예측 모델 만드는 걸 했었는데 전 딥러닝 자체는 거의 까막눈이었지만(기초 원리만 아는 수준) 그 예측 모델이 주는 결과에 대해서는 제가 검증 할 수 있었기 때문에 프롬프트 몇백개 정도 쓴 결과 딥러닝을 거의 하나도 배우지 않았는데도 나름 성공적인 딥러닝 예측 모델을 개발할수 있었습니다. 잘 모르는 부분은 제가 이해 될때까지 설명하게 시켰더니 그래도 써먹을 정도로는 이해가 됐었고 중간중간에 부딪히는 문제점을 돌파해나갈 수 있었네요.
25/10/01 18:04
(수정됨) 추가로 얘기하면 아직 텍스트 이해 능력에 비해 시각적 정보 이해 능력은 많이 부족합니다. 나노바나나니 이런거 나오면서 시각적 작업 관련 부분이 많이 향상되긴 했지만 여전히 그래프를 던져주고 뭔가 하게 하거나 기하학적 정보(직접 그림을 준다는 얘기)를 주고 무언가 하게 했을때 결과물은 매우 실망스러운 경우가 많습니다.
AI 전문가 분한테 들은건데 LLM 작동 원리상 그럴 수 밖에 없다고 하면서 AI연구자들도 잘 인식하고 있는 문제고 개선 알고리즘에 관한 논문을 하나 던져 주시더군요. 논문제목은 'Why is spatial reasoning hard for VLMs? An attention mechanism perspective on focus area' 물론 정확히 이해는 안됐지만 NotebookLM에 던져주고 팟캐스트도 만들게 시키고 이런 저런게 했더니 대충 뭔말인지는 알게 됨. 이것도 LLM의 강점이네요. 내가 잘 알지 못하는 분야도 어느정도 이해할 수 있게 되는거.... 그래프나 기하학적 정보의 경우 그냥 텍스트로 다 풀어서 전달 했을때 결과가 좋았네요. 'x=0, y=1, z=1과 x=2,y=2,z=2인 점을 연결하는 직선을 어쩌구 저쩌구' 등등.... 근데 너무 귀찮은 작업이고 텍스트로 풀어 쓰는 과정에서 뭔가 미스커뮤니케이션이 날 가능성이 크긴 합니다. 그래서 이부분은 좀 향상이 필요 해보입니다.
25/10/01 18:12
저는 거꾸로 텍스트로만 도표상에서의 위치정보를 말했을때 LLM이 잘 못 알아듣다가 텍스트와 그림을 같이 주니까 그제서야 LLM이 알아듣는 경험을 한 적이 있네요.
25/10/01 18:13
(수정됨) 둘다 제공하는 것도 당연히 좋습니다. 그림만 제공하면 헛발질 하는 경우가 많구요. 솔직히 텍스트로 풀어서 쓰는것도 쉽지 않고, 전달 과정에서 뭔가 미스커뮤니케이션이 일어날 가능성이 있으니깐요.
25/10/01 18:12
(수정됨) 그리고 위에도 언급했지만 구글에서 나온 NotebookLM도 굉장히 쓸만합니다. 내가 제공한 출처에서만 답변을 제공하는 RAG 방식이고 Q&A, 요약, 퀴즈, 심지어 팟캐스트까지 제공해서 해당 자료를 환각의 위험성 거의 없이 파악할 수가있습니다. 이 팟캐스트 기능에 대해서는 PGR에 글 쓴 적도 있습니다.
다만 추론모델이 아니라 그렇게 똑똑하지는 않고 그냥 제공한 문서 달달외워서 답변하는 느낌이라보면 됨. https://pgr21.net/freedom/104138?divpage=21&sn=on&keyword=quantum
25/10/01 18:18
구글 계정만 있으면 공짜로도 쓸수 있고 gemini 구독하면 자동으로 프로버전으로 쓸 수 있습니다.
저도 gemini만 구독 했어요 (20달러 짜리...)
25/10/01 18:26
지피티 엄청 똑똑한데 설명을 드럽게 못해서 발표 못하는 공대생 보는 느낌이라 제미나이한테 설명해달라고 하는데 제미나이가 지피티만큼 똑똑하진 않아도 설명은 기가막히게 잘하더라고요
+ 25/10/01 21:58
(수정됨) '특이점이 온다' 갤러리 갑니다. 여기가 국내에서 LLM 관련 정보 가장 빠르고 (새벽에도 안자는 사람들 많아서 거의 미국 시간에 맞춰 실시간으로 정보가 오기도 함) 또 진심인 사람들이 모여 있는 사람입니다. 다만 디시 특성상 정보 옥석 가리기는 필수입니다.
레딧도 있는데 사실 '특이점이 온다' 갤러들중에 AI 광신도들이 많아서 거의 실시간으로 정보 퍼오기 때문에 여기만 잘 봐도 최신 트렌드는 어느정도 따라 갈 수 있고, 굳이 영어로 된 레딧을 갈 필요는 없다 봅니다. 전 AI 새 모델 출시되면 여기 반응 부터 체크합니다. 디시라 뻘글이 많아 옥석가리기 하는게 귀찮으면 그냥 chatGPT나 여러 AI한테 여기 최신 글 동향 요약하라고 시켜도 되요.
+ 25/10/01 22:02
인터넷 초창기엔 디시는 아햏햏 쓰는 특이한 컨셉이 있는 곳
좀 지나선 막장들이 많은 곳 이제는 레딧처럼 게임이나 세부적인 뭔가 하면 디시가 많더라고요... 주제 별로 게시판 창설이 되고 비회원으로 글 댓글 작성 가능한게 크게 작용하는거 같습니다. 근데 이쪽도 그럴 줄은 몰랐네요 감사합니다.
+ 25/10/01 22:04
일단 진입장벽이 없이 자유롭게 오간다는 것때문에 시장통에 막장인 면도 많지만 분야를 가리지 않고 무림고수를 찾으려면 디시의 관련 갤러리를 가라는 얘기가 있기도 하죠. LLM도 마찬 가지입니다. 디시 특성상 80프로 이상이 영양가 없는 뻘글이지만 보석같은 정보들도 있죠. 최신정보도 가장 많고....
25/10/01 18:32
AI 머리속에 지우개가 있는지, 담날에 새로 얘기하면... 다른 사람(?)이 있더라구요.
그거 빼고는 대 만족입니다. 그리고 돈은 쓰면 쓸 수록 더 좋습니다.
25/10/01 18:37
(수정됨) 한 채팅 세션을 넘어가면 정보 저장이 안됩니다. GPT같은 경우는 메모리 기능이 있어서 대략적인 정보는 저장을 해두지만 세세한 정보는 채팅방 새로 파면 거의 다 날라간다 보시면 되요.
그건 현 LLM의 아킬레스 건중 하나인 '장기기억' 문제때문입니다. 심지어 같은 채팅방에서도 너무 길어지면 맨 앞에 내용들은 까먹어요. 그래서 지능 수준은 이미 상당한데도 사람이 하는 작업을 제대로 대체 하기는 힘든겁니다. 그나마 기억 가장 길게 하는게 Gemini이고 그래서 정보량이 방대하면 제미니가 좋습니다. 문서가 정말 길고 그 문서 안에서만 뭔가 답변받고 파악하고 싶으면 NotebookLM이 좋구요. 아마 현존하는 상용 LLM tool중에 정보저장능력이 좋을 겁니다.
25/10/01 18:44
방산계열이라 업무환경이 망분리되어 있는데도 이렇게 편하면 거기서 자유로운 일반 업체에서는 얼마나 편할지 감도 안오네요. 뭔가 도태되는 느낌.
25/10/01 19:40
(논문 줌)
A 읽어보세요. 그리고 특별하거나 탁월한 아이디어가 있다면 3개 꼽아주세요. ChatGPT 1. ... 2. ... 3. ... A [continue] ChatGPT 4. ... 5. ... 6. ... A [continue] ChatGPT 7. ... 8. ... 9. ... 이렇게 이미 답변을 얻었는데, 또 답변해보라는 걸 반복하는게 유용하더군요. 개념을 주고 관련하여 떠오르는 생각을 두 개 이야기해보라 하고, 또 두 개 더 이야기해보라고 하는 걸 반복할 수도 있습니다. 발산적 사고력이죠. (※ Alternative Uses Task, AUT) 서로 다른 분야의 개념 두 개를 줘놓고 그 관계를 떠올려보라 하는 수도 있습니다. 학습한 데이터에는 없는 질문이겠으나 어떻게든 답변을 내놓습니다. 그리고 제가 판단하기로 트랜스포머가 메타인지 능력이 일부 있는 것 같습니다. 특이하거나 혹은 대립되는 지점들을 인식하는 능력이 있을 거란 거죠. 그건 학습시킨 데이터에는 없던 것일 텐데, 트랜스포머 구조를 놓고 볼 때 그게 가능할 거란 판단을 한 적이 있습니다. 경험적으로도 이에 부합한 것 같고요. 어텐션 → 포워드 → 어텐션 → 포워드 → 어텐션 → 포워드 ... 이렇게 가는 과정에서 메타인지가 이뤄지는 것인 듯합니다. 만약 그렇다면 그런 걸 잘 활용하는게 필요하다고 봅니다. LLM에 알파고처럼 가치망이 붙어있는 것도 아닌데, 새로 본 텍스트를 어떻게 요약할 수 있는 걸까요? 어떤 부분은 중첩 또는 차이에 의해 후끈 달아오르기 때문일 거라 생각합니다. 다만 출력은 확률을 거쳐서 나올 테니, 요약을 다시 해보라 하면, 다른 걸 중요하다고 여기고 바꿔 적을 수 있겠지요. 때문에 이걸 이용해서 특이한 걸 뽑아낼 수도 있고 대립되는 걸 나열해달라 할 수도 있습니다. 요약해달라는 것과 다릅니다. 요약은 이미 제가 잘 알고 있고, 익숙하거나 뻔한 것까지도 다 적어놓습니다. 그로인한 비효율이 있습니다. 체계적으로 답변하는 것도 때로는 좋지 않은데, 왜냐하면 낯선 분야를 파고들때 개념 중심으로 공략하는게 좋을 수 있기 때문입니다. 요약은 균형을 추구할 텐데, 전체 텍스트의 균형 따윈 중요치 않고, 내가 모르는 개념 혹은 그것의 기초 개념을 공략하는게 전략적으로 유리할 수 있는 거죠. 그리고 앞서 [continue]은 LLM이 할 말이 남았는데, 분량 때문에 혹은 어떤 억제 명령 때문에 중단했던 걸 뽑아내는 방법이기도 하다고 봅니다. LLM이 품고 있는 벡터가 있을 텐데, 더 뽑아낼 게 있을 것 같다 싶으면 해보는 거죠. 다만 이런 걸 적극적으로 이용하기 위해서는, 한 번에 받는 답변 분량이 짧은게 좋겠고요. 읽는데 시간이 많이 걸리면 비효율적이니까요.
25/10/01 19:49
아 그리고 이상하게 챗지피티는 어플로는 빠릿한데 웹으로 하면 엄청 느려지더라고요 반면에 제미나이는 어플이 너무 허접하고 웹은 괜찮습니다
+ 25/10/01 20:44
(수정됨) 저는 Chatgpt와 제미나이만 좀 심층적으로 사용해서 그 두개만 가지고 애기하겠습니다.
1. Chatgpt는 속도 문제가 너무 크리티컬합니다. Chatgpt의 프로젝트를 사용하는게 길게 이어가면서 같이 먼가를 만들고자 하는 것인데 프로젝트의 채팅이 길어지면 속도 문제가 인내심의 한계를 시험합니다. 거기에 비해 제미나이 2.5프로는 그런면에서 훨씬 좋더군요. 2. LLM을 만능비서가 아니라 나와 같이 일하는 동료라고 생각하면서 서로 피드백을 교환하고, 같이 결과물을 만들어 간다고 접근하면 기대하시는 것 이상의 결과들을 얻으실 겁니다. 이런 상호 커뮤니케이션을 하면서 일을 할때는 chatgpt보다는 제미나이가 더 좋더군요. chatgpt는 너무 사용자의 의견을 수용하는 경향이 있더군요. 3. 하나만 사용하시기 보다는 복수개를 같이 사용하시면 더 좋은 것 같습니다. 예를 들어 어떤 예측 모델을 만들어갈 때 서로 다른 LLM간에는 접근 방법이 다른 경우가 많고, 이때 다른 LLM에서 제안한 방법론을 역으로 현재 같이 작업중인 LLM에 제안해보면 비판적 의견을 받아볼 수도 있고(이것도 도움이 많이 되죠) 혹은 시너지를 일으킬 수도 있습니다. 또는 일을 나눠서 시키는 겁니다. 요즘 많이 사용하는 젠스파크를 이용해서 발표자료를 만들때도, 목차와 페이지구성부터 시작해서 모두 시키기 보다는 제미나이를 이용해서 세부적인 목차와 각 페이지의 내용 요약을 만들고, 이것을 젠스파크에 제공해서 파워포인트 자료로 만드는거죠. 만들어지는 발표자료의 퀄리티가 처음부터 젠스파크에 시키는 것보다 체감상 200% 상승하더군요.
+ 25/10/01 21:04
(수정됨) 저는 논문 리뷰나 특정 문서 리뷰가 필요하면 NotebookLM이 근거도 같이 잘 알려줘서 좋더라구요. 그리고 마인드맵으로도 만들어줘서 요약해서 발표자료 만들기도 편해진 것 같릅니다. 거기서 문서 만으로는 이해가 어려운 것은 제미나이한테 물어보는 식으로 쓰고 있습니다.
그리고 특정 언급이 있는 논문 찾기라던가 그런거는 퍼플렉시티가 잘 찾아주더라구요.
+ 25/10/01 22:14
팟캐스트나 유튜브 백그라운드로 뭐 많이 들으시는 분들 중에 더이상 내 관심사를 잘 파악해서 알려주는 컨텐츠가 안 남았다 하시는 분들께 팁입니다.
관심있는데 엄두가 안 나서 못 읽는 텍스트북들 혹은 방대한 리뷰페이퍼 혹은 리뷰북 PDF 파일 구할 수 있으면 구글 NotebookLM 에 넣어서 [이 책은 챕터가 어떻게 돼?], [전체를 팟캐스트로 만들면 몇개의 에피소드로 쪼개야할까?] 물어보시면 알맞은 분량과 내용을 끊어서 페이지 단위로 에피소드를 쪼개줍니다. 그걸 일단 노트로 저장해두시고 오디오만들기 이용해서 몇페이지부터 몇페이지까지 팟캐스트 만들어줘 내 수준은 ~~~야. 라고 쓰시면 30분짜리 팟캐스트 하나 뚝딱 나옵니다. PC 브라우저로 작업하시고 폰에서도 PC 브라우저 모드로 들어가셔서 다운받아서 재생하시면 됩니다. 앱으로 하면 오디오 파일 여러개 만들어도 하나밖에 안 보이더라고요. 나만 그런가. 물론 학생때처럼 공부하는 수준은 아니겠지만 괜찮아요.
|