지난 한 주 동안 거의 매일 메인 뉴스를 장식한 기사는 중국의 인공지능 회사 DeepSeek였습니다. 엔비디아의 주가가 지난 1월 28일 대비 4.5% 떨어진 상태입니다.
생성형 AI 개발에 있어서 세 가지 믿음이 있었습니다. 첫째, 고성능 그래픽처리장치(GPU)가 어마어마하게 필요하다는 것입니다. 둘째, 학습과 추론을 위한 효과적인 알고리즘입니다. 셋째, 학습시킬 막대한 데이터입니다. DeepSeek는 이 세 가지 믿음을 모두 깼습니다.
우선 저성능 GPU를 가지고 학습했고, 작지만 아주 효율적인 알고리즘 체계를 만들었으며, 데이터를 많이 학습하지 않고도 모델을 완성했습니다. DeepSeek-R1 버전 개발에 557만 달러가 소요됐고, 이는 Meta의 lLama 개발비용의 약 10분의 1 수준입니다. 데이터를 모두 학습하지 않고, (비유적으로) 색인을 학습하면서 추론 기능을 결합시켜 괜찮은 답을 해냈습니다. 생성형 AI에 대한 고정 관념을 넘어선 것입니다.
더 놀라운 사실은 오픈소스(전체는 아닌 듯)로 공개했다는 사실입니다. 많은 사람들이 자체 구축을 해볼 수 있고, 성능 검증을 할 수 있다는 뜻입니다. 실제 MS. nVidia, Amazon 등은 DeepSeek-R1 관련 서비스를 내놨습니다.
- 업계의 관념과 관행을 인정하는 순간 후발주자가 된다. 생성형 AI와 관련해서 한국의 대기업이 그렇지 않을까?
- DeepSeek는 그다지 Deep하지 않고, OpenAI는 Open되지 않았다. 세상은 참 요지경이다.
- 생성형 AI의 궁극적인 시장은 B2B다. 아직 본격적인 시장은 열리지 않았다.
- 오픈 소스로 내부 개발을 통해 사내 모든 데이터를 분석하고 다닌다면 많은 사람들이 필요 없어질 것이다. 실제 구글 등에서 일어나고 있는 현상이다.
- 오픈 소스를 활용하여 각종 디바이스의 개발이 확산될 것 같다.
나는 뭘 해야 할까? ㅎㄷㄷ
※기타 사항
- 추론과 검색을 동시에 제공하는 현 시점 유일한 생성형 AI입니다. 일단 써보시는 걸 추천합니다.
- DeepSeek는 다양한 사용자 정보를 수집합니다. 민감한 정보 입력은 유의하는 것이 좋습니다. - 아무래도 중국 데이터를 많이 학습했다고 하니 중국 관련 정보 제공에 도움이 될 듯 합니다.
|