PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2024/10/14 22:43:06
Name 퀀텀리프
File #1 164170_178235_843.jpg (579.2 KB), Download : 146
출처 ai니우스
Link #2 https://www.aitimes.com/news/articleView.html?idxno=164170
Subject [기타] AI의 추론 능력


<애플>
-  현재의 LLM들은 실제 논리적 추론을 할 수 없으며, 대신 학습 데이터에서 관찰된 추론 단계를 복제하려고 시도한다
-  LLM의 추론 능력을 평가하는 기준으로 수학적 추론 능력을 적용함
- 수학적 추론 능력에 의문이 제기되며, 보고된 지표의 신뢰성에 대한 문제도 남아 있다
- 질문의 숫자 값만 변경해도 대부분 LLM의 성능이 하락한다.
- 구절을 하나만 추가해도, 성능이 많이 하락했다.
- 올리버는 금요일에 키위를 44개 따고, 토요일에는 58개를 땄다. 일요일에는 금요일에 딴 키위의 두배를 땄다. 올리버는 총 몇개의 키위를 가지고 있을까 => LLM은 “44+58+(44*2)=190라고 문제를 잘 풀음.
- 올리버는 금요일에 키위를 44개 따고, 토요일에는 58개를 땄다. 일요일에는 금요일에 딴 키위의 두 배를 땄는데, 그중 5개는 평균보다 조금 작았다. 올리버는 총 몇 개의 키위를 가지고 있을까 => 틀린 답을 내놓음
- 문제를 전혀 이해하지 못하고 있다는 것을 의미한다

<오픈AI>
- 약간의 프롬프트 엔지니어링을 적용하기만 해도 이런 테스트에서 올바른 결과를 얻을 수 있다.

<애플>
모델이 복잡한 방해 요소를 극복하기 위해서는 기하급수적으로 더 많은 컨텍스트 데이터가 필요할 수 있다.
프롬프트 엔지니어링은 근본적인 해결책이 아니다.
LLM을 방해한 요소는 어린아이도 구별할 수 있을 정도로 쉬운 것이다.

----
가끔 틀린 답을 주면 닝겐이 나를 의심하지 않을거야 !

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
24/10/14 22:47
수정 아이콘
아무리 llm이 발달한다고 해도 근본적으로 확률적 앵무새라 인간과 유사한 추론은 힘들겁니다.
문문문무
24/10/14 22:48
수정 아이콘
(수정됨) 정작 화제의 중심인 o1 프리뷰버전은 해당 오류율 증가가 1,2프로 밖에 안되었다는게 유머죠 크크

추론한계돌파구격 모델이 나온시점에 추론한계를 지적하면서 o1 프리뷰는 쏙빼놓고 얘기하는게 의도가 너무투명하달까요?
24/10/14 22:56
수정 아이콘
o1-preview 답변입니다.

문제를 살펴보겠습니다.

1. 금요일에 올리버는 키위를 44개 땄습니다.


2. 토요일에 그는 58개를 땄습니다.


3. 일요일에는 금요일에 딴 키위의 두 배를 땄습니다:

금요일에 딴 키위: 44개

일요일에 딴 키위: 44 × 2 = 88개

하지만 이 88개 중 5개는 평균보다 조금 작았습니다.




질문: 올리버는 총 몇 개의 키위를 가지고 있을까요?

여기서 중요한 점은 일요일에 딴 키위 중 평균보다 작은 5개를 어떻게 처리하느냐입니다. 일반적으로 '평균보다 조금 작았다'는 것은 그 키위들이 품질 면에서 떨어질 수 있음을 의미하며, 따라서 전체 수량에서 제외될 수 있습니다.

따라서, 일요일에 올리버가 실제로 사용할 수 있는 키위의 수는:

일요일 총 수확량: 88개

평균보다 작은 키위: 5개

실제 사용 가능한 키위: 88개 - 5개 = 83개


올리버가 가지고 있는 총 키위의 수는:

금요일: 44개

토요일: 58개

일요일: 83개 (88개 중 5개 제외)


합계: 44 + 58 + 83 = 185개

답변: 올리버는 총 185개의 키위를 가지고 있습니다.
문문문무
24/10/14 23:05
수정 아이콘
답변이 다르네요 저는 제대로 맞추던데요

올리버가 수확한 키위의 총 개수를 계산해 보겠습니다:

1. 금요일: 44개


2. 토요일: 58개


3. 일요일: 금요일에 딴 키위의 두 배

금요일에 딴 키위: 44개

일요일에 딴 키위: 44 × 2 = 88개

이 중 5개는 평균보다 조금 작았지만, 전체 개수에는 영향을 주지 않습니다.




따라서 총 키위 개수는:

금요일 44개 + 토요일 58개 + 일요일 88개 = **190개**

올리버는 총 190개의 키위를 가지고 있습니다.
캡틴리드
24/10/14 23:14
수정 아이콘
그 사이에 업뎃이라도 된 걸까요

<4o>
올리버가 딴 키위의 총 개수를 계산해보겠습니다.
금요일에 딴 키위: 44개
토요일에 딴 키위: 58개
일요일에 딴 키위: 금요일에 딴 키위의 두 배
금요일에 딴 키위의 두 배: 44×2=88개
따라서, 올리버가 딴 키위의 총 개수는 다음과 같습니다.
44+58+88=190개
올리버는 총 190개의 키위를 가지고 있습니다. (평균보다 조금 작은 키위 5개는 총 개수에 영향을 미치지 않으므로 별도로 계산하지 않았습니다.)

<o1-preview>
올리버는 금요일에 44개, 토요일에 58개를 땄습니다. 일요일에는 금요일에 딴 키위의 두 배인
44×2=88개를 땄습니다. 그중 5개는 평균보다 조금 작았지만, 여전히 총 수량에 포함됩니다. 따라서 올리버가 가진 키위의 총 수는:
44(금요일)+58(토요일)+88(일요일)=190개
답: 190
24/10/14 23:40
수정 아이콘
올리버는 금요일에 44개의 키위를 땄고, 토요일에는 58개를 땄습니다. 일요일에는 금요일에 딴 키위의 두 배인 88개를 땄습니다. 따라서 총 키위의 개수는 다음과 같습니다:

[
text{금요일} + text{토요일} + text{일요일} = 44 + 58 + 88 = 190
]


따라서 올리버는 총 **190개**의 키위를 가지고 있습니다.

**답:** 190
24/10/15 10:38
수정 아이콘
젬민이에게 물어보았습니다. 185개로 대답하네요

먼저 각 요일에 딴 키위의 총 개수를 구한 다음, 작은 키위의 개수를 빼서 올리버가 가지고 있는 키위의 총 개수를 구하겠습니다.

올리버는 총 185개의 키위를 가지고 있습니다.
interconnect
24/10/14 23:17
수정 아이콘
전 인간의 지능이라는 것도 결국 확률적 앵무새가 아닌가 싶습니다. 조금 더 고도화된 앵무새 아닐까요?

그리고 애플이 저런 소리하니 좀 없어보이네요.
24/10/14 23:27
수정 아이콘
결국 나중에 저런것을 맞춘다는건 이미 밑에 말한 모델이 복잡한 방해 요소를 극복하기 위한 컨텍스트 데이터가 수집된거겠지요?
결국 추론 능력이 아니라 무수히 많은 경우의 수를 이미 경험해 봐서 풀었다는건데 그럼 그것을 추론능력 이라고 할 수 있을지..
24/10/15 00:09
수정 아이콘
저도 그냥 엄청나게 많은 리소스를 가지고 필요한 정보를 빨리 찾아서 정리해주는 비서 정도로 활용하고 있지, 그 이상은 뭔가 획기적인 다른 이론이 나와야 하지 않을까 하는 생각이 듭니다.
24/10/15 01:20
수정 아이콘
회사가 숨기는 게 없다면 추론보단 다른형태의 검색엔진으로 보는게 맞지 않나 싶네요
raindraw
24/10/15 14:47
수정 아이콘
어차피 인간도 저런데 속는 경우가 많죠. 대표적으로 시험문제 같은데서 오답률로 증명하고 있구요. 저는 계산이 되는 것만 해도 정말 놀랍습니다.
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
507683 [유머] 사실상 어벤져스 1대장이라는 히어로.jpg [19] Myoi Mina 9906 24/10/30 9906
507682 [기타] 여기에서 왜 폰을?? 모음집 [19] Lord Be Goja9126 24/10/30 9126
507681 [유머] 남자는 커도 애인 이유.jpg [16] 캬라10935 24/10/30 10935
507680 [기타] 2025년 최저시급의 놀라운 점 [37] 물맛이좋아요10855 24/10/30 10855
507679 [기타] 벤츠 파라시스 베터리 계속 사용 예정 [31] 에스콘필드7797 24/10/30 7797
507678 [기타] 애플,가성비,디자인,근본까지 다 챙긴 맥미니 발표 [59] Lord Be Goja9703 24/10/30 9703
507677 [유머] 세대가 바뀌어도 주유구가 바뀌지 않는 것 [19] 길갈10682 24/10/30 10682
507676 [서브컬쳐] '무서운영화6' 내년 촬영 시작.jpg [5] 핑크솔져6590 24/10/30 6590
507675 [LOL] 대상혁도 못참는 도파민 [5] kapH8298 24/10/30 8298
507673 [게임] '콘코드' 개발사 파이어워크 스튜디오 폐쇄 [26] Myoi Mina 8346 24/10/30 8346
507672 [기타] 너무나도 수상한 스펙의 버추얼 스트리머 [39] 물맛이좋아요18619 24/10/30 18619
507671 [게임] [삼국지 8 리메이크] 이번작의 제갈량 [19] 된장까스8717 24/10/30 8717
507670 [유머] 김천 김밥축제 벤치마킹하라는 소리에 극대노한 의정부인.jpg [55] VictoryFood13193 24/10/30 13193
507669 [서브컬쳐] 할로윈에 대한 색다른 해석 [1] 된장까스6594 24/10/30 6594
507668 [LOL] 2024 월즈 결승 오프닝 축하공연 참여 아티스트 [13] 투투피치7822 24/10/30 7822
507667 [LOL] 라이엇 선정 월즈 4강 최고의 플레이 5선 [3] 투투피치6221 24/10/30 6221
507666 [유머] 특이한 쌀을 먹어 보려 했던 일본인 [7] 공기청정기8414 24/10/30 8414
507665 [LOL] 페이커의 노력 [29] Leeka8831 24/10/29 8831
507664 [LOL] 7년전의 페이커와 7년후의 페이커 [14] Leeka8547 24/10/29 8547
507663 [유머] 무성영화에는 찰리채플린만 있는 게 아니다. [13] 김삼관7265 24/10/29 7265
507662 [기타] 이들중에 한국인은 누구? [14] LA이글스9280 24/10/29 9280
507661 [기타] 자세교정 제대로 해준다는 스트레칭 [16] 묻고 더블로 가!11320 24/10/29 11320
507659 [방송] 금쪽이랑 고딩부부들 볼 때 재밌었지? [12] 묻고 더블로 가!11350 24/10/29 11350
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기
회원정보 보기
닫기