PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2023/08/01 11:13:46
Name Lord Be Goja
File #1 Screenshot_20230801_111220_Chrome.jpg (450.7 KB), Download : 92
File #2 Screenshot_20230801_111201_Chrome.jpg (102.4 KB), Download : 72
출처 기글하드웨아/ 영국의 한 대학 연구진
Link #2 https://gigglehd.com/gg/soft/14651716
Subject [기타] 가성비까지 좋은 언어




만들기도 쉬운데 팔곳까지 많다니 완전 사기!

하지만 그래서 국내기업의 국내시장파이를 외국계가 기존모델을 써서 대번에 뺏는건 힘들지도..

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
회색사과
23/08/01 11:18
수정 아이콘
말씀하신 대로 예전에는 언어의 장벽이 한국어 NLP 엔지니어들을 지켜줬었습니다만...

요새는 LLM이 영어에 대한 깊은 이해를 바탕으로 적은 자원의 외국어까지 섭렵하고 있습니다 ㅠㅠㅠ

얼마전에 학회 다녀왔더니 어떤 모델은 언어 2천개를 학습했다고 하더라구요..
문문문무
23/08/01 11:19
수정 아이콘
(수정됨) 그래서 그 추론능력을 활용하여 오픈AI에서 올해 5월쯤에 AI모델의 은닉층도 일종의 외국어로 인식하여 해독하려는 시도를 했더라고요
그 논문의 결과자체는 처참했지만 좀더 직관적으로 방법을 개선할여지가 많아보여서 상당히 가능성있다고 보고있고
오픈AI에서도 그렇게 느꼈는지 이후 6월? 7월?쯤에 초지능 정렬연구팀 공개모집할때 업무파트중 하나로 넣기도 했었습니다.
레드불
23/08/01 11:20
수정 아이콘
영어는 문법적으로 고립어라서 효율이 좋나보네요
사람되고싶다
23/08/01 11:24
수정 아이콘
근데 왜 전 영어를 못하죠 흑흑
지식은 있는데 체화가 안됨...
-안군-
23/08/01 11:25
수정 아이콘
우리는 GPT가 아니라서요. 흑흑
문문문무
23/08/01 11:27
수정 아이콘
뭐 어차피 2020년대 안으로 저런 비용논하는게 의미없어질정도로 저렴해질겁니다.
23/08/01 11:27
수정 아이콘
오늘도 영어에 스트레스를 받고 있습니다.
나만 영어 못해 ㅠ
23/08/01 11:30
수정 아이콘
AI도 영어하는데 나는 왜...
회색사과
23/08/01 11:33
수정 아이콘
여러분 AI 도 하는 영어 나는 왜 못하나 자책하지 마세요.

AI는 네이티브 영어 사용자입니다. (첫 언어가 영어..)

잘하는게 당연해요
오타니
23/08/01 11:34
수정 아이콘
한글이 최고 아닌가
망고베리
23/08/01 11:39
수정 아이콘
중국어도 효율이 좋겠네요. 문법도 단순하다니까
-안군-
23/08/01 11:41
수정 아이콘
실제로 좋습니다. 거의 글자단위로 끊으면 되는 수준이라..
-안군-
23/08/01 11:41
수정 아이콘
트랜스포머의 설계 자체가 영어에 특화돼있으니...
트랜스포머에 대한 설명을 처음 봤을때, 이건 한글에 쓰기엔 별로 안좋겠다는 느낌을 받긴 했어요. 그런데 그 구조를 다 뜯어고친 우리만의 무엇을 만들기엔 돈도, 시간도, 인력도 너무 부족하죠.
문문문무
23/08/01 11:43
수정 아이콘
당장 8월중으로 한국어 특화모델이라 선전하는 네이버의 하이퍼클로바가 나오긴합니다.
jjohny=쿠마
23/08/01 12:24
수정 아이콘
두근두근
밥과글
23/08/01 12:41
수정 아이콘
덕분에 18만원 하던 주식이 23만원..
덴드로븀
23/08/01 12:01
수정 아이콘
세종대왕님 어째서 한글을 만들때 AI 시대를 예상하지 못했던겁니까!
Lord Be Goja
23/08/01 12:05
수정 아이콘
크읔 나랏말씀을 듕귝과 같게 바꾸면 되는것을!
블레싱
23/08/01 12:11
수정 아이콘
한자쓰는 세계관 생각하면...
블래스트 도저
23/08/01 12:18
수정 아이콘
대왕님은 문자만 만드신...
한글 자체는 PC 시대에도 유용하죠 동아시아 문자치고 입력도 편하고
23/08/01 12:22
수정 아이콘
뭐야 가성비 좋은 연어 어디갔어 연어
abc초콜릿
23/08/01 13:00
수정 아이콘
궁금한 건 언어는 갈수록 단순해지는 경향을 가지는데 그러면 애초에 왜 라틴어나 고전 그리스어 같은 언어는 진작에 단순해지지 않고 그 시절엔 끝내주는 복잡한 문법을 가지고 있다가 나중에 그 언어를 쓰게 된 사람들이 갈라지면서 단순해진 걸까요
23/08/01 13:04
수정 아이콘
문자가 발명되고 글쓰는 기술이 발전하면서 굳이 문법적으로 세밀하게 언어를 구사할 필요성이 없어진 영향인 듯 하네요. 앞뒤 문맥으로도 충분히 뜻을 파악할 수 있으니 말이죠. 만약 문자가 없거나 작문이 시원찮은 시대라면 오해의 소지가 적도록 정밀하게 말을 해야 할 듯.
계층방정
23/08/01 13:14
수정 아이콘
문법이 복잡할수록 정보 손실에 강하죠. 영어를 예로 들어 I saw him whom... (읍읍!!)에서 말이 잘리면 그래도 어떤 행위의 대상이 되는 누군가를 보고 있었다는 걸 알 수 있는데, 현대에서처럼 whom 대신 who를 써서 I saw him who... (읍읍!!)에서 말이 잘리면 더 알 수 있는 게 없죠.
계층방정
23/08/01 13:25
수정 아이콘
Chatgpt에 물어보니 고전 언어들의 문법이 복잡한 이유로 여러 가지를 드네요.
1. 변화의 축적
2. 정교한 표현 추구
3. 지식인들의 언어 사용
4. 종교적, 의례적 사용
5. 기록할 자원이 부족(문법을 복잡하게 하는 대신 써야 할 분량은 줄어듦)
6. 표준화 X
7. 언어 쓰는 사람이 적음

반면 시간이 지나면서 표준화되고, 기록에 비해 구전 자료가 풍부해지고, 언어 사용자가 많아지고 여러 언어들이 섞이면서 문법이 단순해지는 경향을 띈다고 합니다.
계층방정
23/08/01 13:11
수정 아이콘
논문 요약에서는 여러 언어를 모두 공정하게 다루는 토큰화 모델이 필요하다고 결론을 맺고 있네요.

그리고 논문의 그림 3을 보면 토큰화 길이와 실행 시간 표가 나오는데 여러 가지 재미있는 결과들이 많습니다.

* 토큰화 길이가 제일 짧은 것은 영어고 실행 시간이 가장 적은 것은 말레이어(그리고 줄루어는 근소한 차이로 2등)로 나옵니다.
* 스페인어도 영어와 말레이어의 사이에 점이 찍히고, 그 외에도 서양 언어들의 성능이 전반적으로 좋습니다.
* 중국어는 의외라면 의외고 당연하다면 당연한 건데 번체가 간체보다 더 성능이 좋습니다.
* 가장 성능이 나쁜 건 미얀마 일부에서 쓰이는 언어인 샨어고, 그 외에도 종카어, 타밀어, 버마어도 상당히 부진합니다.
23/08/01 14:51
수정 아이콘
한국어도 한글로 표기할 때 모아쓰기 말고 풀어쓰기로 하면 좀 낫지 않을까요?
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
484118 [유머] 롤)??:LCK 공지 제대로 안하냐 ? [11] 동굴곰8711 23/08/02 8711
484117 [LOL] 표정이 정말 너무 클린한 케리아 [35] 한입9979 23/08/02 9979
484116 [유머] 부모가 진상인데 약간은 공감가는 민원.JPG [64] 동굴곰13822 23/08/02 13822
484115 [LOL] 페이커를 죽인 광동을 죽인다.mp4 [1] insane6998 23/08/02 6998
484114 [LOL] 망한 LCK 스타일 밴픽의 축소판 [27] 길갈8912 23/08/02 8912
484113 [기타] 바로 아래글(484111번글)과 반대되는 일도 있었다는 [14] 아롱이다롱이7672 23/08/02 7672
484112 [서브컬쳐] 제목만 봐도 보고싶은 웹소설 제목 [9] VictoryFood9305 23/08/02 9305
484111 [기타] "애한테 그리 윽박지를 일이에요" 얼음과 음료수 집어던진 부모 [58] 아롱이다롱이13013 23/08/02 13013
484110 [게임] 중년게이머 김실장 추가 입장문 업로드 [89] 묻고 더블로 가!14723 23/08/02 14723
484109 [유머] 드래곤볼 브로리 근황.jpg [21] 고쿠11032 23/08/02 11032
484105 [기타] 물이 너무 차가워 겨울바다 놀러온 느낌이라는 동해안 바닷가 [27] 아롱이다롱이12871 23/08/02 12871
484104 [게임] 스파6 대회중 누드가 나와 당황 [43] 졸업12170 23/08/02 12170
484103 [유머] 40대 중반 치과의사를 따라하는 40대 초반 스트리머(약후) [2] 쎌라비13374 23/08/02 13374
484102 [연예인] 양자경, 전 페라리 ceo랑 결혼 [3] Avicii11007 23/08/02 11007
484101 [유머] 집 에어컨이 고장 났습니다. [51] Croove14363 23/08/02 14363
484100 [기타] 북상중이던 태풍이 일본쪽으로 급 커브하는 이유 [43] 아롱이다롱이10531 23/08/02 10531
484099 [유머] (레딧) 미니 m&m 튜브에 작은 원통이 끼인 사람.jpg [21] 카미트리아9272 23/08/02 9272
484098 [방송] 군대가고 싶어서 귀화한다는거 해명한 조나단.jpg [60] insane13688 23/08/02 13688
484097 [기타] 태풍 카눈 근황 [42] 카루오스15158 23/08/02 15158
484096 [기타] 안될과학 초전도체 한줄요약.jpg [8] insane10652 23/08/02 10652
484095 [LOL] 한화 상체 3인방 목둘레 대결 결과.jpg [15] insane9492 23/08/02 9492
484094 [유머] 중세 유럽 기사들 전용 식당의 구현 [13] 보리야밥먹자11618 23/08/02 11618
484093 [유머] 미국에서 갤럭시 플립5 트레이드 인 가격 [44] Leeka12784 23/08/02 12784
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로