:: 게시판
:: 이전 게시판
|
- PGR21 관련된 질문 및 건의는 [건의 게시판]을 이용바랍니다.
- (2013년 3월 이전) 오래된 질문글은 [이전 질문 게시판]에 있습니다. 통합 규정을 준수해 주십시오. (2015.12.25.)
통합규정 1.3 이용안내 인용"Pgr은 '명문화된 삭제규정'이 반드시 필요하지 않은 분을 환영합니다.법 없이도 사는 사람, 남에게 상처를 주지 않으면서 같이 이야기 나눌 수 있는 분이면 좋겠습니다."
23/12/04 09:24
개나소나 다 만든다고 생각되시면.. 그건 대부분 fine-tuning이구요.
실제로 백본부터 만드는 플레이어는 어느정도 인프라를 굴릴 힘이 있는 사이즈의 기업들입니다. 걔중에는 좀 작은 모델 만들면서 진짜 큰 모델을 만들까 말까 고민만 하는 경우가 대부분이구요. 주로 AI 업계 소식은.. 주로 그런 소식들에 밝은 사람들을 facebook, twitter, linkedin 등에서 팔로우 하는 것부터 시작인것 같구요. 요즘 관련된 포럼이 많으니 좀 나가서 감을 잡아보시는것도 방법일 듯 합니다.
23/12/04 09:35
사실 개나소나라고 말씀 드리긴 했지만 그게 우리나라 통신사들, 삼성 LG 같은 대기업이긴 합니다... 그치만 LLM 시장이 글로벌 빅테크 수준에서도 경쟁이 치열한데 과연 국내 대기업 수준으로 살아남을 수 있는가? 정도가 의문이더라고요. 한국 전체에서도 그나마 살아남을 플레이어가 나오면 다행 아닌가 싶었는데...
괜찮은 인플루언서들 추천 주시면 감사하겠습니다. 포럼 같은 것도 좀 찾아봐야겠네요.
23/12/04 12:11
저도 전문가는 아닙니다만 적어도 한국 내에서는 빅테크 발끝이라도 따라올만한 플레이어는 없다고 보여집니다. 통신사나 삼엘이 한국에서나 대기업이지 세계 레벨에서는 규모면에서도 부족하고, 그렇다고 투자할 컴퓨팅 리소스가 넉넉한것도 아니고, 노하우가 있는 것도 아니고, 하다못해 돈이나 비전으로 빅테크 리서쳐들 빼올만한 수준도 아니니까요. LLM 특성상 그럴듯한걸 보여주는 초기 단계까지는 몰라도 롱테일 문제로 들어가면 글쎄요.
그리고 업계 소식은 가성비충님 말씀대로 링크드인의 유명인들을 팔로우하는것에서 시작하시면 되긴 합니다만 내부에서 보는 바로는 각 플레이어들이 자기 달리기 바쁘고 대부분의 정보들은 기밀이라 제대로 된 정보가 공유되고 있다고 보긴 힘들 것 같네요. 구글의 gemini가 공개되는 시점에서 윤곽이 드러날만한 것들이 좀 있지 않나 생각합니다.
23/12/04 13:11
솔직히 저도 그게 의문이었습니다. 아무리 봐도 잽이 안되는데 대체 왜 다들 약속한듯이 발표를???? 솔직히 국내 중소 B2B나 B2G용으로 하나쯤만 겨우 살아남지 않을까 싶은데...
사실 막 엄청난 정보가 알고싶은 건 아니고 약간 영화보면서 팝콘 뜯는 느낌이긴 합니다 흐흐. 그냥 떡밥 더 나올 때까지 잊고 있는 게 낫겠군요.
23/12/04 13:39
백본을 직접 만든다 - 글로벌에서도 10개 회사가 안됩니다. 1,2,3 위 사이에서도 차이가 솔찌 좀 나는 것 같습니다. - 논외
백본을 직접 굽는다 - 이게 우리나라 LLM 하겠다는 회사들이 갖는 포지션이죠 백본 갖다 쓴다 (튜닝은 한다) - 이게 LLM으로 서비스 한다는 대부분 회사입니다. - 논외 일단.. 백본을 설계하고 학습시켜볼 인프라나 능력은 우리 나라에는 없습니다. 백본을 직접 굽는 건 의미가 있냐 - (공개된 모델을 한국어용으로 수정하고 학습시키는 것) 이건 비용 절감의 효과가 있습니다. 챗GPT나 GPT4 같은 탑급 모델이 성능은 무조건 좋아요. 그런 모델을 직접 만들 수는 없죠... 우리나라 사정으로는 근데 저거 써서 서비스 만들면 비용이 어마어마 합니다. (챗GPT로 논문에 쓸 데이터 구축만 해봐도 천만원 이천만원은 우스워요.. 상용서비스를 하면 사이즈에 따라 다르겠지만 수억 수십억 우스울겁니다.) 대안으로... 한국어 LLM 모델을 만들어서, 특정 서비스용으로 튜닝해서 쓰는 방법이 있습니다. 탑급 모델보다 멍청할거고 범용성은 더 떨어지겠지만, 튜닝 잘하고 잘 만지작 거리면 특정 서비스 특화용으로는 쓸 수 있는거죠.. 한국에서 LLM 정말 잘 해서 글로벌 탑 되겠다는 기업은 없을 겁니다. Open AI 말고는 공개 모델로 돈 버는 회사도 아마 없을거에요.. (돈 주고 쓸거면 open AI 쓰죠..) 특정 서비스 특화로 어케든 비벼보는 모델 만들어서 비용 절감하는게 목표라고 봅니다. (예전에 서버 관리 비용이나 감가 생각하고 AWS 같은 클라우드로 넘어갔던 회사들 상당수는 다시 서버실 지은 것처럼요...)
23/12/04 13:58
백본을 굽는 건 라마 같은 오픈 소스 모델 기반으로 만드는 걸까요?
글로벌 빅테크 모델은 죄다 너무 무겁고 비싸서 좀 성능 떨어지지만 싼 모델 수요도 있다고는 생각하는데 뭔가 그거 감안해서도 너무 많은 기업들이 달려드는 모양새 같은 게 의문이었습니다. 말씀 주신 거 종합해보면 실제로 그 경량 모델 싸게 파는 쪽이라기보단 그냥 기업 내부적으로 서비스 런칭할 때 써먹을 AI라는 느낌이네요. 외부에서 돈 주고 사다 쓰느니 그냥 우리가 해보자는 느낌?
23/12/05 00:07
ClovaX가 그래도 바닥부터 만든 모델인데 써보시면 성능이 그닥입니다. 그래도 특정 도메인에서는 GPT-4 파인튜닝보다 라마를 커스터마이즈한 모델들이 유용할 수 있고 이런 영역에서 국내 기업들이 성과를 낼 수 있을 것이라고 봅니다.
한국AI는 일단 잊으시고, 트위터에서 팔로우 많은 연구자들 팔로우해서 보시면 됩니다.
23/12/05 22:13
그쵸 흐흐. 사실 국내 최고인 네이버도 이 정도인데 딴 놈들은 대체 무슨 깡으로 하겠다는 거지??? 정도가 궁금했던지라. 그래도 나름 완전 뒤떨어져서 쳐다보고만 있는 수준은 아닌 것 같아 다행이네요. 1군은 못먹어도 2군은 먹어야 나름 부스러기라도 주워 먹지...
23/12/05 22:15
사실 딱 KT 보고 궁금해서 쓴 글입니다 흐흐. 아니 네이버까진 그렇다치고 얘는 대체 뭐지???? 싶었거든요 흐흐. 하는 거 보니까 간만 살짝 보는 것도 아니고 거의 여기에 적극적으로 베팅하는 모양새던데 대체 무슨 자신감으로 그러나 싶었거든요. 제가 모르는 뭔가가 있었던가 싶었던 흐흐.
|