PGR21.com
- 모두가 건전하게 즐길 수 있는 유머글을 올려주세요.
- 유게에서는 정치/종교 관련 등 논란성 글 및 개인 비방은 금지되어 있습니다.
Date 2023/08/01 11:13:46
Name Lord Be Goja
File #1 Screenshot_20230801_111220_Chrome.jpg (450.7 KB), Download : 88
File #2 Screenshot_20230801_111201_Chrome.jpg (102.4 KB), Download : 69
출처 기글하드웨아/ 영국의 한 대학 연구진
Link #2 https://gigglehd.com/gg/soft/14651716
Subject [기타] 가성비까지 좋은 언어




만들기도 쉬운데 팔곳까지 많다니 완전 사기!

하지만 그래서 국내기업의 국내시장파이를 외국계가 기존모델을 써서 대번에 뺏는건 힘들지도..

통합규정 1.3 이용안내 인용

"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.
법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
회색사과
23/08/01 11:18
수정 아이콘
말씀하신 대로 예전에는 언어의 장벽이 한국어 NLP 엔지니어들을 지켜줬었습니다만...

요새는 LLM이 영어에 대한 깊은 이해를 바탕으로 적은 자원의 외국어까지 섭렵하고 있습니다 ㅠㅠㅠ

얼마전에 학회 다녀왔더니 어떤 모델은 언어 2천개를 학습했다고 하더라구요..
문문문무
23/08/01 11:19
수정 아이콘
(수정됨) 그래서 그 추론능력을 활용하여 오픈AI에서 올해 5월쯤에 AI모델의 은닉층도 일종의 외국어로 인식하여 해독하려는 시도를 했더라고요
그 논문의 결과자체는 처참했지만 좀더 직관적으로 방법을 개선할여지가 많아보여서 상당히 가능성있다고 보고있고
오픈AI에서도 그렇게 느꼈는지 이후 6월? 7월?쯤에 초지능 정렬연구팀 공개모집할때 업무파트중 하나로 넣기도 했었습니다.
레드불
23/08/01 11:20
수정 아이콘
영어는 문법적으로 고립어라서 효율이 좋나보네요
사람되고싶다
23/08/01 11:24
수정 아이콘
근데 왜 전 영어를 못하죠 흑흑
지식은 있는데 체화가 안됨...
-안군-
23/08/01 11:25
수정 아이콘
우리는 GPT가 아니라서요. 흑흑
문문문무
23/08/01 11:27
수정 아이콘
뭐 어차피 2020년대 안으로 저런 비용논하는게 의미없어질정도로 저렴해질겁니다.
23/08/01 11:27
수정 아이콘
오늘도 영어에 스트레스를 받고 있습니다.
나만 영어 못해 ㅠ
23/08/01 11:30
수정 아이콘
AI도 영어하는데 나는 왜...
회색사과
23/08/01 11:33
수정 아이콘
여러분 AI 도 하는 영어 나는 왜 못하나 자책하지 마세요.

AI는 네이티브 영어 사용자입니다. (첫 언어가 영어..)

잘하는게 당연해요
오타니
23/08/01 11:34
수정 아이콘
한글이 최고 아닌가
망고베리
23/08/01 11:39
수정 아이콘
중국어도 효율이 좋겠네요. 문법도 단순하다니까
-안군-
23/08/01 11:41
수정 아이콘
실제로 좋습니다. 거의 글자단위로 끊으면 되는 수준이라..
-안군-
23/08/01 11:41
수정 아이콘
트랜스포머의 설계 자체가 영어에 특화돼있으니...
트랜스포머에 대한 설명을 처음 봤을때, 이건 한글에 쓰기엔 별로 안좋겠다는 느낌을 받긴 했어요. 그런데 그 구조를 다 뜯어고친 우리만의 무엇을 만들기엔 돈도, 시간도, 인력도 너무 부족하죠.
문문문무
23/08/01 11:43
수정 아이콘
당장 8월중으로 한국어 특화모델이라 선전하는 네이버의 하이퍼클로바가 나오긴합니다.
jjohny=쿠마
23/08/01 12:24
수정 아이콘
두근두근
밥과글
23/08/01 12:41
수정 아이콘
덕분에 18만원 하던 주식이 23만원..
덴드로븀
23/08/01 12:01
수정 아이콘
세종대왕님 어째서 한글을 만들때 AI 시대를 예상하지 못했던겁니까!
Lord Be Goja
23/08/01 12:05
수정 아이콘
크읔 나랏말씀을 듕귝과 같게 바꾸면 되는것을!
블레싱
23/08/01 12:11
수정 아이콘
한자쓰는 세계관 생각하면...
블래스트 도저
23/08/01 12:18
수정 아이콘
대왕님은 문자만 만드신...
한글 자체는 PC 시대에도 유용하죠 동아시아 문자치고 입력도 편하고
23/08/01 12:22
수정 아이콘
뭐야 가성비 좋은 연어 어디갔어 연어
abc초콜릿
23/08/01 13:00
수정 아이콘
궁금한 건 언어는 갈수록 단순해지는 경향을 가지는데 그러면 애초에 왜 라틴어나 고전 그리스어 같은 언어는 진작에 단순해지지 않고 그 시절엔 끝내주는 복잡한 문법을 가지고 있다가 나중에 그 언어를 쓰게 된 사람들이 갈라지면서 단순해진 걸까요
23/08/01 13:04
수정 아이콘
문자가 발명되고 글쓰는 기술이 발전하면서 굳이 문법적으로 세밀하게 언어를 구사할 필요성이 없어진 영향인 듯 하네요. 앞뒤 문맥으로도 충분히 뜻을 파악할 수 있으니 말이죠. 만약 문자가 없거나 작문이 시원찮은 시대라면 오해의 소지가 적도록 정밀하게 말을 해야 할 듯.
계층방정
23/08/01 13:14
수정 아이콘
문법이 복잡할수록 정보 손실에 강하죠. 영어를 예로 들어 I saw him whom... (읍읍!!)에서 말이 잘리면 그래도 어떤 행위의 대상이 되는 누군가를 보고 있었다는 걸 알 수 있는데, 현대에서처럼 whom 대신 who를 써서 I saw him who... (읍읍!!)에서 말이 잘리면 더 알 수 있는 게 없죠.
계층방정
23/08/01 13:25
수정 아이콘
Chatgpt에 물어보니 고전 언어들의 문법이 복잡한 이유로 여러 가지를 드네요.
1. 변화의 축적
2. 정교한 표현 추구
3. 지식인들의 언어 사용
4. 종교적, 의례적 사용
5. 기록할 자원이 부족(문법을 복잡하게 하는 대신 써야 할 분량은 줄어듦)
6. 표준화 X
7. 언어 쓰는 사람이 적음

반면 시간이 지나면서 표준화되고, 기록에 비해 구전 자료가 풍부해지고, 언어 사용자가 많아지고 여러 언어들이 섞이면서 문법이 단순해지는 경향을 띈다고 합니다.
계층방정
23/08/01 13:11
수정 아이콘
논문 요약에서는 여러 언어를 모두 공정하게 다루는 토큰화 모델이 필요하다고 결론을 맺고 있네요.

그리고 논문의 그림 3을 보면 토큰화 길이와 실행 시간 표가 나오는데 여러 가지 재미있는 결과들이 많습니다.

* 토큰화 길이가 제일 짧은 것은 영어고 실행 시간이 가장 적은 것은 말레이어(그리고 줄루어는 근소한 차이로 2등)로 나옵니다.
* 스페인어도 영어와 말레이어의 사이에 점이 찍히고, 그 외에도 서양 언어들의 성능이 전반적으로 좋습니다.
* 중국어는 의외라면 의외고 당연하다면 당연한 건데 번체가 간체보다 더 성능이 좋습니다.
* 가장 성능이 나쁜 건 미얀마 일부에서 쓰이는 언어인 샨어고, 그 외에도 종카어, 타밀어, 버마어도 상당히 부진합니다.
23/08/01 14:51
수정 아이콘
한국어도 한글로 표기할 때 모아쓰기 말고 풀어쓰기로 하면 좀 낫지 않을까요?
목록 삭게로! 맨위로
번호 제목 이름 날짜 조회
484011 [기타] (약후) 각종 이슈에 존재감은 없어졌지만 계속 생산되고 있는 AI [19] 묻고 더블로 가!9856 23/08/01 9856
484010 [기타] 오픈빨이 빠진 스레드를 구할 묘책은? [12] Lord Be Goja8818 23/08/01 8818
484009 [기타] 상온 초전도체 시뮬 성공한 버클리 연구소는 어떤 곳? [9] 우주전쟁10541 23/08/01 10541
484008 [유머] "교수님 이제 굽겠습니다" [4] 구상만8826 23/08/01 8826
484007 [유머] 초전도체로 지금 고민 중인 사람들 [24] 코우사카 호노카10131 23/08/01 10131
484006 [유머] 슈카월드 근황 [10] 된장까스10392 23/08/01 10392
484005 [유머] 초전도치근황.jpg [79] 구상만11263 23/08/01 11263
484004 [유머] 후끈해진 강남역 [9] 닭강정10531 23/08/01 10531
484003 [유머] 예정에 없던 전세계 락 페스티벌 [6] biangle9559 23/08/01 9559
484002 [유머] 전세계 커뮤니티 근황.chojeondo [25] OneCircleEast10986 23/08/01 10986
484001 [유머] 교수님 굽다보니 이상한 게 나왔는데요.. [10] 길갈9767 23/08/01 9767
484000 [유머] [mbti] 새로운 룸메가 왔다 [9] 바밥밥바7793 23/08/01 7793
483998 [유머] ???: 오또상 우리나라는 초전도체 못 만들어요? [4] 구상만9622 23/08/01 9622
483995 [유머] ??? : 교수님 LK-99 다 구웠습니다. [10] 카루오스9530 23/08/01 9530
483992 [기타] 상온 초전도체 설마 진짜??? [24] 우주전쟁11977 23/08/01 11977
483991 [유머] LK-99를 다 같이 만들어봤으면 좋겠다고 한 이유 [5] 카루오스8146 23/08/01 8146
483990 [유머] 초전도체 LK-99 근황의 근황 [50] OneCircleEast16777 23/08/01 16777
483989 [기타] 싱글 1800->2200으로 오른 갤s24 with 스냅8gen3 [18] Lord Be Goja7630 23/08/01 7630
483987 [유머] 배가 벌렁벌렁 [29] 길갈9834 23/08/01 9834
483985 [LOL] 배송대행지가 영어로 뭔지 아십니까 [18] KanQui#17831 23/08/01 7831
483983 [기타] X) 간판 교체란 참 힘든 일입니다. [11] 타카이7314 23/08/01 7314
483982 [LOL] 쵸비가 진에어 테스트 떨어진 썰 [9] 쎌라비8621 23/08/01 8621
483981 [유머] 일본에서 발견된 신종 식물 [16] 달은다시차오른다11516 23/08/01 11516
목록 이전 다음
댓글

+ : 최근 1시간내에 달린 댓글
+ : 최근 2시간내에 달린 댓글
맨 위로