PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2025/02/02 10:15:10
Name Quantumwk
File #1 원래_문제.png (5.0 KB), Download : 2149
File #2 GPT가_인식한_문제.png (3.6 KB), Download : 2148
Link #1 https://pgr21.com/freedom/103651
Subject [일반] AI가 수능 수학 킬러문제도 맞추네요2 - 오류 수정 및 기타 AI모델 테스트 결과 (수정됨)




첫번째 이미지: 원래 문제
두번째 이미지: GPT가 인식한 문제


같은 주제로 반복 글 올려서 죄송합니다만 이전 글에 오류가 있어서 정리할 필요가 있기에 글을 다시 팠습니다.

그리고 여러 모델에서 이 문제 풀려본 결과도 공유 합니다.


o3가 자기 풀이과정이 틀리지 않았다고 계속 우겨서(?) 검토를 계속 하던 도중에 오랜만에 무한 급수의 재배열 정리라던지 이런 것 까지 살펴봤고 해당 문제를 GPT가 텍스트로 옮기는 과정에서 원래 문제랑은 좀 다르게 된 점을 발견했습니다.

결론은 문제 잘못 알려 줘서 수학 강사랑 다르게 푼 거고 제대로 알려주니 정상적으로 풀었습니다. (여전히 약간 비효율 적이기는 함)

제가 이전 글에서 'GPT가 무한 급수를 다루던 과정에서 오류가 있었습니다'라고 단 댓글은 모두 틀렸습니다. 혼란을 드려 죄송합니다.

제대로 인식하고 푼 풀이 링크 입니다. 여전히 사람보다는 좀 더 복잡하게 푸는 데 사람은 사고 과정을 좀 건너 뛸 수 있지만 o3는 차근차근 풀어서 그런 듯 하고 방향성은 제대로 잡은 것으로 보입니다.

https://chatgpt.com/share/679ee6e1-1508-8000-8321-fad629fd6005


그리고 해당 문제를 타 AI 모델에 풀려본 결과도 공유 합니다. (한번만 질문함)

1) 정답 맞춤
GPT-o3mini-high (26초), GPT-o3mini (27초), GPT-o1 (52초), 딥시크-R1 (202초)
2) 거의 정답에 근접
딥시크 V3: 1)과 똑같이 풀어나가다가 막판에 홀수,짝수 조건에서 오류를 범해서 오답
3) 오답
GPT4o (유료 결제시 기본 모델): 중간 부터 삼천포로 빠짐, Claude: 완전 핀트 잘못 잡음
4) 손도 못댐
GPT4o-mini (무료시 기본 모델), GPT4 legacy, 구글 Gemini 2.0 Flash



통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
FlutterUser
25/02/02 23:57
수정 아이콘
크크..전 글의 댓글에서 말씀드렸듯... 그런겁니다..
그냥 AI는 꾸준히 빠른속도로 발전하고 있는거라고 생각합니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
103665 [일반] 개인 서명 갖고 계신가요. [41] 김삼관6387 25/02/03 6387 2
103664 [정치] 윤석열, 언론사 단전·단수 이상민에 직접 지시 [8] 빼사스7497 25/02/03 7497 0
103663 [정치] 서울 명동 중국대사관 앞 反中 집회… 대만 출신 華商 “이유 없이 시비 걸어” [53] 기찻길7166 25/02/03 7166 0
103662 [일반] [설문] 영화 산업의 위기, 누가 우선 희생해야 할까 [87] 슈테판6731 25/02/03 6731 2
103661 [정치] 트럼프의 협상방식이 국제 무대에서 실패하는 이유 [69] 크레토스12172 25/02/03 12172 0
103660 [일반] 인민을 위해 복무하라 이거 겁나 야한 소설이었네요 [20] 마술의 결백증명6219 25/02/03 6219 8
103659 [정치] 40세 이준석 "세대교체로 정치판갈이"…사실상 대권도전 선언 [280] 철판닭갈비12251 25/02/03 12251 0
103658 [정치] 오세훈, AI인재 1만명 양성하겠다. [98] 바람돌돌이12853 25/02/02 12853 0
103657 [정치] 안철수 "20조 규모 AI·민생 추경 추진해야" [80] 호옹이 나오10882 25/02/02 10882 0
103656 [일반] 美, 4일부터 캐나다·멕시코에 25% 전면 관세…中에 10% [142] 유머12504 25/02/02 12504 4
103655 [일반] AI가 수능 수학 킬러문제도 맞추네요2 - 오류 수정 및 기타 AI모델 테스트 결과 [1] Quantumwk3805 25/02/02 3805 0
103654 [일반] <러브레터> - 어쩌면, 우리 모두는 그림자를 그리워하는지도 모른다. (약스포) [17] aDayInTheLife4550 25/02/02 4550 4
103653 [정치] 남산 판타지 - 그 아름다운 곳 [6] singularian3318 25/02/02 3318 0
103652 [정치] 尹측 "헌재 문형배·이미선·정계선 재판관 스스로 탄핵 심리서 빠져야" 의견서 제출 [81] 빼사스11656 25/02/01 11656 0
103651 [일반] AI가 수능 수학 킬러문제도 맞추네요 - 오류 발견, 수정 글 추가 작성 [59] Quantumwk9722 25/02/01 9722 2
103650 [일반] 미국 필라델피아 도심지에서 경비행기 추락사고가 발생했습니다 [8] EnergyFlow8343 25/02/01 8343 0
103649 [일반] 눈 내리는 서울, 겨울 출사(사진 多) [4] 판을흔들어라5366 25/01/31 5366 20
103648 [일반] 그 여자는 무슨 생각을 했을까 [17] 글곰9803 25/01/31 9803 15
103645 [정치] 트럼프 "워싱턴 항공 충돌 사고, FAA의 다양성 채용이 문제일 수도 있다" [94] EnergyFlow14866 25/01/31 14866 0
103644 [일반] 이제는 대부분의 사람들이 모르는 SK하이닉스의 놀라운 과거 [23] 독서상품권10728 25/01/31 10728 2
103643 [정치] 우려되는 국민의힘 지지자들의 극우화 [208] 계층방정23228 25/01/31 23228 0
103642 [일반] 소리로 찾아가는 한자 72. 볕 양(昜)에서 파생된 한자들 [6] 계층방정1910 25/01/31 1910 2
103641 [정치] 전한길 선을 한참 넘네요. [140] This-Plus19605 25/01/30 19605 0
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로