PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2023/08/01 11:13:46
Name Lord Be Goja
File #1 Screenshot_20230801_111220_Chrome.jpg (450.7 KB), Download : 88
File #2 Screenshot_20230801_111201_Chrome.jpg (102.4 KB), Download : 69
출처 기글하드웨아/ 영국의 한 대학 연구진
Link #2 https://gigglehd.com/gg/soft/14651716
Subject [기타] 가성비까지 좋은 언어




만들기도 쉬운데 팔곳까지 많다니 완전 사기!

하지만 그래서 국내기업의 국내시장파이를 외국계가 기존모델을 써서 대번에 뺏는건 힘들지도..

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
회색사과
23/08/01 11:18
수정 아이콘
말씀하신 대로 예전에는 언어의 장벽이 한국어 NLP 엔지니어들을 지켜줬었습니다만...

요새는 LLM이 영어에 대한 깊은 이해를 바탕으로 적은 자원의 외국어까지 섭렵하고 있습니다 ㅠㅠㅠ

얼마전에 학회 다녀왔더니 어떤 모델은 언어 2천개를 학습했다고 하더라구요..
문문문무
23/08/01 11:19
수정 아이콘
(수정됨) 그래서 그 추론능력을 활용하여 오픈AI에서 올해 5월쯤에 AI모델의 은닉층도 일종의 외국어로 인식하여 해독하려는 시도를 했더라고요
그 논문의 결과자체는 처참했지만 좀더 직관적으로 방법을 개선할여지가 많아보여서 상당히 가능성있다고 보고있고
오픈AI에서도 그렇게 느꼈는지 이후 6월? 7월?쯤에 초지능 정렬연구팀 공개모집할때 업무파트중 하나로 넣기도 했었습니다.
레드불
23/08/01 11:20
수정 아이콘
영어는 문법적으로 고립어라서 효율이 좋나보네요
사람되고싶다
23/08/01 11:24
수정 아이콘
근데 왜 전 영어를 못하죠 흑흑
지식은 있는데 체화가 안됨...
-안군-
23/08/01 11:25
수정 아이콘
우리는 GPT가 아니라서요. 흑흑
문문문무
23/08/01 11:27
수정 아이콘
뭐 어차피 2020년대 안으로 저런 비용논하는게 의미없어질정도로 저렴해질겁니다.
23/08/01 11:27
수정 아이콘
오늘도 영어에 스트레스를 받고 있습니다.
나만 영어 못해 ㅠ
23/08/01 11:30
수정 아이콘
AI도 영어하는데 나는 왜...
회색사과
23/08/01 11:33
수정 아이콘
여러분 AI 도 하는 영어 나는 왜 못하나 자책하지 마세요.

AI는 네이티브 영어 사용자입니다. (첫 언어가 영어..)

잘하는게 당연해요
오타니
23/08/01 11:34
수정 아이콘
한글이 최고 아닌가
망고베리
23/08/01 11:39
수정 아이콘
중국어도 효율이 좋겠네요. 문법도 단순하다니까
-안군-
23/08/01 11:41
수정 아이콘
실제로 좋습니다. 거의 글자단위로 끊으면 되는 수준이라..
-안군-
23/08/01 11:41
수정 아이콘
트랜스포머의 설계 자체가 영어에 특화돼있으니...
트랜스포머에 대한 설명을 처음 봤을때, 이건 한글에 쓰기엔 별로 안좋겠다는 느낌을 받긴 했어요. 그런데 그 구조를 다 뜯어고친 우리만의 무엇을 만들기엔 돈도, 시간도, 인력도 너무 부족하죠.
문문문무
23/08/01 11:43
수정 아이콘
당장 8월중으로 한국어 특화모델이라 선전하는 네이버의 하이퍼클로바가 나오긴합니다.
jjohny=쿠마
23/08/01 12:24
수정 아이콘
두근두근
밥과글
23/08/01 12:41
수정 아이콘
덕분에 18만원 하던 주식이 23만원..
덴드로븀
23/08/01 12:01
수정 아이콘
세종대왕님 어째서 한글을 만들때 AI 시대를 예상하지 못했던겁니까!
Lord Be Goja
23/08/01 12:05
수정 아이콘
크읔 나랏말씀을 듕귝과 같게 바꾸면 되는것을!
블레싱
23/08/01 12:11
수정 아이콘
한자쓰는 세계관 생각하면...
블래스트 도저
23/08/01 12:18
수정 아이콘
대왕님은 문자만 만드신...
한글 자체는 PC 시대에도 유용하죠 동아시아 문자치고 입력도 편하고
23/08/01 12:22
수정 아이콘
뭐야 가성비 좋은 연어 어디갔어 연어
abc초콜릿
23/08/01 13:00
수정 아이콘
궁금한 건 언어는 갈수록 단순해지는 경향을 가지는데 그러면 애초에 왜 라틴어나 고전 그리스어 같은 언어는 진작에 단순해지지 않고 그 시절엔 끝내주는 복잡한 문법을 가지고 있다가 나중에 그 언어를 쓰게 된 사람들이 갈라지면서 단순해진 걸까요
23/08/01 13:04
수정 아이콘
문자가 발명되고 글쓰는 기술이 발전하면서 굳이 문법적으로 세밀하게 언어를 구사할 필요성이 없어진 영향인 듯 하네요. 앞뒤 문맥으로도 충분히 뜻을 파악할 수 있으니 말이죠. 만약 문자가 없거나 작문이 시원찮은 시대라면 오해의 소지가 적도록 정밀하게 말을 해야 할 듯.
계층방정
23/08/01 13:14
수정 아이콘
문법이 복잡할수록 정보 손실에 강하죠. 영어를 예로 들어 I saw him whom... (읍읍!!)에서 말이 잘리면 그래도 어떤 행위의 대상이 되는 누군가를 보고 있었다는 걸 알 수 있는데, 현대에서처럼 whom 대신 who를 써서 I saw him who... (읍읍!!)에서 말이 잘리면 더 알 수 있는 게 없죠.
계층방정
23/08/01 13:25
수정 아이콘
Chatgpt에 물어보니 고전 언어들의 문법이 복잡한 이유로 여러 가지를 드네요.
1. 변화의 축적
2. 정교한 표현 추구
3. 지식인들의 언어 사용
4. 종교적, 의례적 사용
5. 기록할 자원이 부족(문법을 복잡하게 하는 대신 써야 할 분량은 줄어듦)
6. 표준화 X
7. 언어 쓰는 사람이 적음

반면 시간이 지나면서 표준화되고, 기록에 비해 구전 자료가 풍부해지고, 언어 사용자가 많아지고 여러 언어들이 섞이면서 문법이 단순해지는 경향을 띈다고 합니다.
계층방정
23/08/01 13:11
수정 아이콘
논문 요약에서는 여러 언어를 모두 공정하게 다루는 토큰화 모델이 필요하다고 결론을 맺고 있네요.

그리고 논문의 그림 3을 보면 토큰화 길이와 실행 시간 표가 나오는데 여러 가지 재미있는 결과들이 많습니다.

* 토큰화 길이가 제일 짧은 것은 영어고 실행 시간이 가장 적은 것은 말레이어(그리고 줄루어는 근소한 차이로 2등)로 나옵니다.
* 스페인어도 영어와 말레이어의 사이에 점이 찍히고, 그 외에도 서양 언어들의 성능이 전반적으로 좋습니다.
* 중국어는 의외라면 의외고 당연하다면 당연한 건데 번체가 간체보다 더 성능이 좋습니다.
* 가장 성능이 나쁜 건 미얀마 일부에서 쓰이는 언어인 샨어고, 그 외에도 종카어, 타밀어, 버마어도 상당히 부진합니다.
23/08/01 14:51
수정 아이콘
한국어도 한글로 표기할 때 모아쓰기 말고 풀어쓰기로 하면 좀 낫지 않을까요?
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
483987 [유머] 배가 벌렁벌렁 [29] 길갈9835 23/08/01 9835
483985 [LOL] 배송대행지가 영어로 뭔지 아십니까 [18] KanQui#17832 23/08/01 7832
483983 [기타] X) 간판 교체란 참 힘든 일입니다. [11] 타카이7314 23/08/01 7314
483982 [LOL] 쵸비가 진에어 테스트 떨어진 썰 [9] 쎌라비8623 23/08/01 8623
483981 [유머] 일본에서 발견된 신종 식물 [16] 달은다시차오른다11518 23/08/01 11518
483980 [기타] 가성비까지 좋은 언어 [27] Lord Be Goja11558 23/08/01 11558
483979 [유머] 이상한 재능 쓰는 남편 [11] 메롱약오르징까꿍11713 23/08/01 11713
483978 [기타] 출연진이 전원 사망한 영상물이 올라온 ott [11] Lord Be Goja10909 23/08/01 10909
483977 [동물&귀욤] 태백애서 발견된 담 넘어가는 구렁이.jpg [29] insane9513 23/08/01 9513
483976 [유머] 현재 디씨 소설 갤러리를 불타게 만든 요상한 떡밥 [50] Myoi Mina 9712 23/08/01 9712
483975 [방송] 사장님 말실수에 "연봉 1억 내놔" 소송 건 중국집 배달원 [6] Croove10871 23/08/01 10871
483973 [스포츠] 헬스장 몸풀러 갔는데 내 뒤에서 맨시티 덕배가 몸풀고 있다.jpg [9] insane9738 23/08/01 9738
483972 [유머] 소설 [구운몽]속 멋진 구절들... [30] 우주전쟁9312 23/08/01 9312
483971 [서브컬쳐] 세대차이를 절감한 아버지 [31] 인간흑인대머리남캐11711 23/08/01 11711
483970 [스포츠] 아시아 투어를 마친 맨시티 인스타 근황 [20] 인간흑인대머리남캐10838 23/08/01 10838
483969 [유머] 물 부족 해결법 [15] 인간흑인대머리남캐10864 23/08/01 10864
483968 [기타] 6호 태풍 카눈 경로 급 변경.jpg [24] insane11333 23/08/01 11333
483967 [유머] 창렬한 타코벨 [12] Means10640 23/08/01 10640
483965 [유머] 뜬금 없는 햄버거 서머 퍼스트팀 [61] KanQui#111873 23/08/01 11873
483964 [동물&귀욤] 아 씨...이건 또 뭐지... [4] 공기청정기7303 23/08/01 7303
483963 [기타] 이번 상온초전도체에 대한 전체적인 스토리 [11] 한사영우12447 23/08/01 12447
483962 [기타] 현재 ip 추적중이라는 신림동 살인예고글 [31] Lord Be Goja13588 23/08/01 13588
483961 [기타] [고전]누군가에겐 경험담인 노래 [9] 닉넴길이제한8자7597 23/07/31 7597
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로