PGR21.com
- 자유 주제로 사용할 수 있는 게시판입니다.
- 토론 게시판의 용도를 겸합니다.
Date 2025/02/02 10:15:10
Name Quantumwk
File #1 원래_문제.png (5.0 KB), Download : 2219
File #2 GPT가_인식한_문제.png (3.6 KB), Download : 2205
Link #1 https://pgr21.com/freedom/103651
Subject [일반] AI가 수능 수학 킬러문제도 맞추네요2 - 오류 수정 및 기타 AI모델 테스트 결과 (수정됨)




첫번째 이미지: 원래 문제
두번째 이미지: GPT가 인식한 문제


같은 주제로 반복 글 올려서 죄송합니다만 이전 글에 오류가 있어서 정리할 필요가 있기에 글을 다시 팠습니다.

그리고 여러 모델에서 이 문제 풀려본 결과도 공유 합니다.


o3가 자기 풀이과정이 틀리지 않았다고 계속 우겨서(?) 검토를 계속 하던 도중에 오랜만에 무한 급수의 재배열 정리라던지 이런 것 까지 살펴봤고 해당 문제를 GPT가 텍스트로 옮기는 과정에서 원래 문제랑은 좀 다르게 된 점을 발견했습니다.

결론은 문제 잘못 알려 줘서 수학 강사랑 다르게 푼 거고 제대로 알려주니 정상적으로 풀었습니다. (여전히 약간 비효율 적이기는 함)

제가 이전 글에서 'GPT가 무한 급수를 다루던 과정에서 오류가 있었습니다'라고 단 댓글은 모두 틀렸습니다. 혼란을 드려 죄송합니다.

제대로 인식하고 푼 풀이 링크 입니다. 여전히 사람보다는 좀 더 복잡하게 푸는 데 사람은 사고 과정을 좀 건너 뛸 수 있지만 o3는 차근차근 풀어서 그런 듯 하고 방향성은 제대로 잡은 것으로 보입니다.

https://chatgpt.com/share/679ee6e1-1508-8000-8321-fad629fd6005


그리고 해당 문제를 타 AI 모델에 풀려본 결과도 공유 합니다. (한번만 질문함)

1) 정답 맞춤
GPT-o3mini-high (26초), GPT-o3mini (27초), GPT-o1 (52초), 딥시크-R1 (202초)
2) 거의 정답에 근접
딥시크 V3: 1)과 똑같이 풀어나가다가 막판에 홀수,짝수 조건에서 오류를 범해서 오답
3) 오답
GPT4o (유료 결제시 기본 모델): 중간 부터 삼천포로 빠짐, Claude: 완전 핀트 잘못 잡음
4) 손도 못댐
GPT4o-mini (무료시 기본 모델), GPT4 legacy, 구글 Gemini 2.0 Flash



통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
FlutterUser
25/02/02 23:57
수정 아이콘
크크..전 글의 댓글에서 말씀드렸듯... 그런겁니다..
그냥 AI는 꾸준히 빠른속도로 발전하고 있는거라고 생각합니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회 추천
103736 [일반] 딥시크가 그냥 나온 게 아니네요. 중국 과학기술 연구력이 대단하네요. [192] 전기쥐16832 25/02/10 16832 7
103733 [일반] 딥 시크 이거... 야잘알이네요. [24] 닉언급금지9273 25/02/10 9273 1
103729 [일반] 시리즈 웹소설 추천 - <배움의 어머니> 서양식 타임루프 아카데미물. [26] Restar4711 25/02/10 4711 8
103728 [일반] [서평]《명령에 따랐을 뿐!?》 - 부도덕한 명령에 저항하는 길을 찾고자 한 어느 신경과학자의 분투 [14] 계층방정5063 25/02/10 5063 6
103727 [정치] 민주주의에 대해서 다시 생각해 보게 된 방송. [19] 굿샷11850 25/02/10 11850 0
103726 [일반] <9월 5일: 위험한 특종> - 미디어의 맨얼굴을 보다.(노스포) [11] aDayInTheLife5357 25/02/10 5357 5
103725 [일반] 생성형 AI 뭘 써야 할까? 유료결제가 필요할까? - 모델 별 평가와 가이드 [120] Quantumwk14160 25/02/09 14160 20
103724 [일반] [일상수필] 성공(LSD)과 실패(딸기케이크) 그리고 어머니의 꽃게탕은 맛있고 [5] 판을흔들어라3908 25/02/09 3908 0
103723 [일반] 과연 결혼과 출산율은 올라갈수 있을것인가?? [113] 한사영우9916 25/02/09 9916 7
103722 [일반] 유료화 임박 웹툰 추천-<이발소 밑 게임가게> 부제: 명불허전 하일권 [9] lasd2415805 25/02/09 5805 4
103721 [일반] 마우스 포테이토에서 MY FAMICOM EXHIBITION 을 관람하고 왔습니다. [2] 及時雨3221 25/02/09 3221 2
103719 [일반] 웹소설은 왜 이렇게 되었을까? [106] 김김김9525 25/02/09 9525 18
103718 [일반] 무엇이 한국을 분열시킬 수 있는가 [67] meson8311 25/02/09 8311 9
103717 [일반] 티베트 지하 어딘가에 있다는 전설의 지하왕국, 샴발라 [18] 식별8047 25/02/09 8047 10
103716 [일반] [팝송] 제가 생각하는 2024 최고의 앨범 Best 15 [10] 김치찌개5578 25/02/09 5578 14
103715 [일반] 샘 알트만 도쿄대 질의응답 번역 [17] Q-tip10299 25/02/08 10299 9
103714 [일반] 전설의 지하왕국 아가르타와 지구 공동설을 알아보자 [9] 식별6943 25/02/08 6943 18
103713 [일반] 2차대전 종전 후 세계에서 트럼프만큼 역사를 혼자 바꾼 사람은 없겠죠?? [28] 홍철7916 25/02/08 7916 1
103712 [일반] 검찰에서 악마를 다시 만났다. [44] 간옹손건미축10182 25/02/08 10182 30
103711 [일반] 『눈물을 마시는 새』 재론 - 눈부시게 잔혹한 이야기 [11] meson4043 25/02/08 4043 6
103710 [일반] 주말엔 고양이 아닐까요? [25] 대단하다대단해5146 25/02/08 5146 23
103706 [일반] 게임게시판 등의 운영 방치 및 전반적 운영 개선에 대하여 [66] 퍼그8043 25/02/08 8043 16
103705 [일반] 글로벌 DeepSeek 논란 정리 [26] 스폰지뚱9240 25/02/08 9240 15
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기