:: 게시판
:: 이전 게시판
|
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다. 통합 규정을 준수해 주십시오. (2015.12.25.)
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
23/11/15 17:42
순수하게 능력이 떨어집니다.
질문안에 답변이 다 들어있어요. 1. 한국어를 기반으로 2. 네이버 안에 있는 방대한 데이터로 만들어졌지요. 그럼 이제 무엇이 문제인 것인가. 1. 한국어를 기반으로 전문 기술 또는 관련 노하우나 데이터가 필요하신 분들은 아시겠지만, 학술지 영역에서도, 그 외 영역에서도, 온갖 다양한 서브 데이터들 영역에서도 생각보다 국내에 번역되어 한국어로 제공된 전문 자료가 턱없이 부족합니다. 그래서 상당수 업계 분들은 전문화 데이터들의 자국어 번역이 활발한 일본을 부러워 하는 실정입니다. 2. 네이버 안에 있는 방대한 데이터로 과연 네이버에 얼마나 (방대하고 자시고를 떠나서) 정확한 데이터가 있을까요? 지식인의 데이터의 신뢰성은 얼마나 되며, 카페등에서 얻을 수 있는 데이터의 범위는 과연 얼마나 되며, 또한 각 데이터들의 전문화 된 답변과 지식으로서의 효용성은 얼마나 될까요? 개발로만 따져봐도, 과연 네이버의 모든 데이터를 다 긁어봐야 외국의 특정 사이트만한 수준의 전문화 데이터가 나오긴 하겠습니까... 당연히 데이터 모델링 관련 기술도 중요하지만, 학습형 AI 에서 가장 중요한 건 1차적으로 그 근간이 되는 [학습 시킬 데이터] 입니다. 네이버 안의 방대한 데이터??? 제게 있어서 네이버 안의 방대한 데이터 = 디씨인사이드의 방대한 게시물 수준의 느낌 밖에 없습니다. 근간이 되는 데이터가 부실한데, 결과물이 멀쩡할 리가 없습니다. 전 세계 데이터를 죄다 긁어도 정확도에 물음표가 떠오르는 답변을 던져주는 것이 현재 ChatGPT 인데, 네이버의 방대한 데이터가 뭔 의미가 있다는 건지 모르겠습니다 -_-; 제 기준으로 네이버는 단 하루도 [검색 엔진] 이었던 적이 없고, 여긴 그냥 다양한 자료를 카테고라이징 한 분류 사이트죠. 애초에 부족한 검색 기술력 + 신뢰성도 없고 편향된 (쓸데없이 방대한) 데이터 가 모여서 생긴 결과물이 바로 말씀하신 결과입니다. 오죽하면 네이버 블로그의 꼴도 보기 싫은 따봉짤들이 네이버의 대표 마스코트 밈화 되었겠어요.
|