PGR21.com
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다.
통합 규정을 준수해 주십시오. (2015.12.25.)
Date 2023/05/19 18:12:58
Name 송마야
Subject [질문] 많이 쓰는 한글 순위? (수정됨)
안녕하세요
한글은 수 많은 글자들이 조합이 가능한데
흔히 많이 쓰이는 글자들수는 몇개나 될까요?
흃 이라던가 밢 이런 글자들은 평상시에 쓰이지 않으니 이런것 빼고
예를들어 단문 소설에 등장하는 글자 종류는 몇개나 될까요?
검색해보다가 못 찾아서 질게에 여쭤 봅니다

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
덴드로븀
23/05/19 18:31
수정 아이콘
구글 bard
1차
한글은 24개의 자음과 모음으로 구성되어 있으며, 이 자음과 모음을 조합하여 수많은 단어를 만들 수 있습니다. 그러나 흔히 많이 쓰이는 단어는 그리 많지 않습니다. 국립국어원에서 발행한 ‘2020년 세종말뭉치’에 따르면, 한국어에서 가장 많이 쓰이는 단어는 ‘이다’로 1,407,538건이 사용되었습니다. 그 뒤를 이어 ‘이, 그, 은, 는, 것, 있다, 안, 의, 할, 말, 때, 와, 을, 의, 로, 나, 에서, 으로, 는가, 는지, 을까, 을까요, 을까요?, 을까요?’가 사용되었습니다.

위에서 언급한 단어들은 모두 10만건 이상 사용된 단어들입니다. 10만건 미만으로 사용된 단어들도 많지만 그 수는 매우 많습니다. 따라서 흔히 많이 쓰이는 한글 단어의 수는 그리 많지 않다고 할 수 있습니다.

2차

흔히 많이 쓰이는 한글 단어의 수는 약 20,000개로 추정됩니다. 국립국어원에서 발행한 ‘2020년 세종말뭉치’에 따르면, 한국어에서 10만건 이상 사용된 단어는 약 5,000개, 1만건 이상 사용된 단어는 약 15,000개입니다. 따라서 흔히 많이 쓰이는 한글 단어의 수는 약 20,000개로 추정할 수 있습니다.

한글은 24개의 자음과 모음으로 구성되어 있으며, 이 자음과 모음을 조합하여 수많은 단어를 만들 수 있습니다. 그러나 흔히 많이 쓰이는 단어는 그리 많지 않습니다. 왜냐하면, 한글의 자음과 모음은 조합에 제약이 있기 때문입니다. 예를 들어, 자음 ‘그’은 모음 ‘아’와는 결합할 수 있지만 모음 ‘오’와는 결합할 수 없습니다. 또한, 자음 ‘느’은 모음 ‘어’와는 결합할 수 있지만 모음 ‘이’와는 결합할 수 없습니다.

이러한 제약 때문에, 한글에서 만들 수 있는 단어의 수는 실제로는 매우 적습니다. 흔히 많이 쓰이는 단어의 수는 그 중에서도 더 적습니다.

chat gpt 무료
한글은 조합이 가능한 글자의 수가 많기 때문에 흔히 쓰이는 단어의 수를 정확히 파악하는 것은 어렵습니다. 그러나 일반적으로 사용되는 단어들의 수는 약 10만 개 이상이라고 추정됩니다.

한글의 음절은 초성, 중성, 종성의 결합으로 이루어져 있으며, 각각의 자음과 모음은 조합하여 음절을 형성합니다. 한글의 초성은 14개, 중성은 10개, 종성은 14개로 이루어져 있습니다. 따라서 한글 음절의 총 가지수는 14 * 10 * 14 = 1,960입니다.

한글 단어는 음절의 조합으로 이루어지며, 조합의 범위는 매우 넓습니다. 흔히 쓰이는 단어는 수천 개에서 수만 개까지 다양하며, 이는 명확한 통계 데이터가 없어 추정하기 어렵습니다. 한글 단어의 수는 계속해서 변하고 새로운 단어가 생겨나기 때문에 정확한 수를 파악하는 것은 어렵습니다.

다만, 한국어 사전에 수록된 단어의 수를 기준으로 살펴보면, 일반적으로 사용되는 단어의 수는 약 30만 개에서 40만 개 정도로 추정됩니다. 이는 일상 대화나 글쓰기에서 흔히 사용되는 단어의 수를 포함한 것으로, 과학 용어, 전문 용어, 사회적으로 제한된 분야의 어휘 등은 이에 포함되지 않을 수 있습니다.

따라서 한글의 흔히 사용되는 단어의 수는 약 10만 개 이상이라고 할 수 있지만, 이는 정확한 수치가 아니며 참고로만 받아들이시기 바랍니다.
송마야
23/05/19 18:41
수정 아이콘
답변감사합니다 제가 헷갈리게 글을 적은것 같더라구요. 그래서 질문글을 살짝 수정했습니다 단어가 아니고 사용된 글자의 종류 수 입니다
에이치블루
23/05/19 21:08
수정 아이콘
한글의 초성은 14개, 중성은 10개, 종성은 14개로 이루어져 있습니다. 따라서 한글 음절의 총 가지수는 14 * 10 * 14 = 1,960입니다.
<- 이건 정보 오류인 것 같네요...쌍자음이 있고 조합모음이 있는데 다 빼버렸네요. 아이고...
다크서클팬더
23/05/19 19:11
수정 아이콘
빙 검색엔진은 한글의 음절을 물어봤더니 알파벳으로 답변을 하고 있더군요.
자음 '이응'이 가장 많이 쓰인다 말고는 뭐...
23/05/19 19:52
수정 아이콘
음절을 물어보신건가보네요.. 저도 음절 빈도는 잘 모르겠고
단모음키보드를 쓰다가 알게된건데 음소(음운?) 빈도는 https://story.pxd.co.kr/958 요기한번참고해보세요.
아마도 '아'가 제일 많이 쓰이는 음절인 듯 합니다
계층방정
23/05/19 21:10
수정 아이콘
궁금하신 부분과 매우 관련이 높은 논문이 있네요.
https://www.kci.go.kr/kciportal/ci/sereArticleSearch/ciSereArtiView.kci?sereArticleSearchBean.artiId=ART002577322
이은하, 남기춘, 세종 말뭉치에 나타난 한국어 음절의 빈도와 분포, 언어과학연구 92집 (2020년 3월) 79-130

3.2.1에서 세종 말뭉치에 사용된 전체 음절의 가짓수는 2110개며, 상위 20개가 그 중 33.35%, 상위 100개가 67.28%를 차지했다고 합니다. 100회 이상 나타난 음절은 617가지로 이들이 전체의 97.71%를 차지했습니다. 반대로 10회 이하로 사용된 음절은 326개며, 그 중 100개는 단 한 차례만 사용되었습니다. 가장 많이 사용된 음절은 '이'며, 그 다음으로는 '다', '는', '의', '에'가 뒤를 이었습니다.

이 논문에서는 일반명사와 용언(동사, 형용사)로 또 나누어서 같은 분석을 했는데요.
일반명사에서는 '이', '사', '기', '자', '적' 순으로 많이 사용되었고, 용언에서는 '다', '하', '되', '시', '리' 순으로 많이 사용되었습니다.

더 나아가서 첫째 음절과 둘째 음절의 빈도를 또 분석했는데, 전체에서는 첫째 음절에 '그', '이', '있', '것', '사', 둘째 음절에는 '이', '는', '다', '리', '어' 순으로 많이 사용되었습니다. 이것도 일반명사와 용언으로 나누어 보면, 일반명사에서는 첫째 음절에 '대', '사', '수', '비', '전', 둘째 음절에 '사', '리', '수', '기', '이' 순으로 많이 사용되었습니다. 용언에서는 첫째 음절에 '재', '부', '가', '수', '무', 둘째 음절에 '다', '하', '리', '지', '어' 순으로 많이 사용되었습니다.

논문이 길긴 한데 자세하게 분석이 되어 있어서 직접 읽어보셔도 재미있을 것 같습니다.
송마야
23/05/19 23:04
수정 아이콘
와 두분 답변 감사합니다 댓글 링크 들어가서 보고 많은 부분이 해소되었습니다 감사합니다!
회색사과
23/05/20 08:52
수정 아이콘
아…
예전에 임베딩이 유행할 때 한국어 위키피디아 데이터를 대상으로 각 음절별 카운트 세본 게 있는데 어딨는지 모르겠네요 크크크
송마야
23/05/20 11:10
수정 아이콘
답변 감사합니다! 정말 궁금한 데이터 군요 혹시 찾으신다면 공유 부탁드립니다
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
173757 [질문] 이거 스팸문자일까요? [16] 스물다섯대째뺨11369 23/11/28 11369
173756 [질문] 지금 난리난 손모양 자기들끼리 모인곳가서 인증을 하면 영웅취급이라도 해주나요? [22] 제드10564 23/11/28 10564
173755 [질문] 짜증이나는 역치가 매우 낮습니다. 어떻게 올릴까요? [34] 교자만두10892 23/11/28 10892
173754 [질문] 이번 월즈 결승에서 페이커의 '그 토스' 플레이 설명이 듣고 싶습니다. [26] 득이12155 23/11/28 12155
173752 [질문] 폰을 바꾸려고 합니다 [19] 월터화이트9512 23/11/28 9512
173751 [질문] 커피머신 추천(네스프레소? 일리?) [15] intothe_random12318 23/11/27 12318
173750 [삭제예정] 안드로이드 공기계로 쓸만한 모델 추천 좀 부탁드려요. [5] 삭제됨7767 23/11/27 7767
173749 [질문] 만화책보관 씌우는 것 [8] 오타니9624 23/11/27 9624
173748 [질문] 애프터 쉐이브를 추천받고자 합니다. [3] 2시퇴근8509 23/11/27 8509
173747 [질문] 메인 SSD하드 완전 복사가 가능한가요? [5] onDemand8301 23/11/27 8301
173746 [질문] 치킨을 먹다 이물질이 나왔다고 합니다.. [5] 총알인생9224 23/11/27 9224
173745 [질문] 네이버플러스 멤버십 쓰시는 분들 계시나요?? [7] 아엠포유9306 23/11/27 9306
173744 [질문] 저절로 창문 손상에 대한 책임 소재 [15] 삭제됨8819 23/11/27 8819
173743 [질문] 맥북 그래픽 카드가 두개인데 어떻게 된건지 알 수 있을까요? [3] monkeyD8814 23/11/27 8814
173742 [질문] 3월 말 이탈리아 여행 질문 드립니다. [4] Alfine8702 23/11/27 8702
173741 [질문] 미국여행을 했는데 기름값이 전부 결제취소됐습니다. [6] 10037 23/11/27 10037
173740 [질문] 클로그립은 비대칭 마우스랑 안어울리는 걸까요 [3] 호비브라운8676 23/11/27 8676
173739 [삭제예정] PC구매하려는데 이 2가지중에서 하나 골라주실수 있나요? [19] 흔솔략9226 23/11/27 9226
173738 [질문] 새로 산 PC에서 유툽 잔랙이 생깁니다. [9] 무냐고11364 23/11/27 11364
173737 [질문] 제주도 제주시 한경면 시내에서 카톡 택시 잘 잡힐까요? [2] 짐바르도8855 23/11/27 8855
173736 [질문] 화장품을 통한 피부관리의 원리는 무엇일지요..? [9] nexon8831 23/11/26 8831
173735 [질문] [약혐주의] 발에 이상하게 생긴 물집(?) 이게 뭔가요.. [3] 다리기8320 23/11/26 8320
173734 [질문] 롤은 왜 다른 스포츠처럼 연봉공개를 안하나요? [7] 벤티사이즈11400 23/11/26 11400
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로