바이라인네트워크에서 스타트업을 리뷰합니다. 줄여서 ‘바스리’. 투자시장이 얼어붙어도 뛰어난 기술력과 반짝이는 아이디어, 새로운 비즈니스 모델을 가진 스타트업은 계속해 탄생하고 있습니다. 세상을 깜짝 놀라게 하겠다고 출사표를 던진 이들을 바이라인의 기자들이 만나봤습니다.
사회 생활을 시작하면서 가장 많은 조언을 들었던 것 중 하나를 꼽으라면, “도장 함부로 찍지 말아라”다. 어른 말 잘 들으면 떡이 하나 더 생길지 모르겠지만, 도장 잘못 찍으면 패가망신할 수도 있다. 살면서 계약서에 서명할 일이 생각보다 많다. 때마다 근로계약서에 도장을 찍고, 집을 옮기면서도 계약은 이뤄진다.
계약의 당사자가 기업 간이 되다 보면 오가는 돈의 크기도 커진다. 일거리 수주나 투자, 인수합병과 관련한 계약서는 매우 두텁고, 그 속에 숨은 조항 하나에 회사의 운명이 갈리기도 한다. 계약서를 검토하고 관리해야 하는 법무팀의 머리도 터진다. 머리 아프게 계약서 이야길 꺼낸 이유는 오늘 <바스리>에서 소개할 스타트업 ‘비에이치에스엔(BHSN)’이 회사 법무팀의 일손을 보조할 인공지능 솔루션을 만들어서다.
BHSN은 법무법인 율촌 등에서 근무한 임정근 변호사가 지난 2020년 창업했다. 자체 인공지능(AI) 기술력과 제품 플랫폼 개발역량을 가지고AI 법무 솔루션을 개발해 기업(B2B)에 공급하는 일을 요체로 한다. 지난해 연말, 때마침 챗GPT가 등장하면서 기업이 각종 업무에 AI를 도입하는 것도 이 회사에 기회가 됐다. CJ제일제당, SK텔레콤 등이 법무 업무에 BHSN의 솔루션을 도입했다. 지난 8월에는 알토스벤처스 등으로부터 60억원의 투자를 유치했고, 회사의 AI 솔루션 개발을 총괄할 김형준 최고AI책임자(CAIO)가 합류하기도 했다.
김형준 CAIO는 BHSN에 합류하기 전에는 SKT의 초거대언어모델, 네이버 클로바노트 및 클로바X 서비스를 개발에 참여한 자연어처리(NLP) 전문가다. BHSN에 합류한 이후에는 회사의 AI 기술 총괄역을 맡아 법률 특화 거대언어모델 (BHSN-BERT, BHSN-LLM) 개발 등을 이끌고 있다. 바로 그를, 서울 강남구에 위치한 BHSN 회의실에서 최근 만났다. 요즘 AI 전문가는 최고 인재 대우를 받는데 왜 대기업이 아니라 스타트업을 택했느냐 물었더니 “AI를 비즈니스로 잘 하려면 특정 도메인(버티컬)과 기술, 데이터가 있어야 하는데, 한 분야만 잘 파는 것은 스타트업이 오히려 잘 할 거라 봤다”면서 웃었다.
김형준 CAIO와의 인터뷰를 전하기 전에, 일단 이 회사가 어떤 AI 기반 기술과 제품을 만드는지를 먼저 설명하는 것이 낫겠다.
ㆍ ‘엔터프라이즈 AI 리걸 솔루션(legal solution)’을 만든다. 기업이 계약을 하거나 법무 관련 업무를 할 때 사용할 수 있는 특화 AI 솔루션을 개발하는 것이다. 주요 AI 기술과 제품은 다음과 같다.
ㆍBHSN-LLM_ 소형 LLM이다. LLM을 풀어 쓰면 Large Language Model로, 번역하면 거대 언어 모델이다. 대표적으로 오픈AI의 GPT 시리즈나 메타(페이스북)의 라마(Llama), 네이버의 하이퍼클로바X와 같은 것이 있다. 그런데 이 LLM은 모든 지식을 다 습득하다보니 특정한 하나의 지식만 다루는데는 너무 크고, 정교하지 못하며, 비용이 많이 든다. 그래서 특정 지식에 집중해 규모를 줄여 거대언어모델을 만든 것을 소형 LLM이라고 부른다. BHSN은 법률 지식에 기초한 소형 LLM을 주로 만든다.
ㆍBHSN-버트(BERT)_ 법무 서비스에 LLM을 쓰려면 정확도가 높아야 하는데, 이를 위해서는 분류나 추출 등을 잘 해야 한다. 데이터에서 중요한 요소를 추정하고 추출하는데 초점이 맞춰진 딥러닝 모델이다.
ㆍAI 리뷰_ AI가 특정 계약서나 다량의 문서에서 중요한 내용을 검토하거나 사람이 놓친 부분을 찾는 등의 역할을 한다. 한국어 외에 영문, 일본어 등으로 서비스의 범위를 확장하려 한다.
ㆍ계약서 관리 시스템(CLM)_ 계약 작성부터 이행 관리까지 전체 계약 과정을 디지털화해 통합 관리하는 솔루션이다.
BHSN에 대한 사전지식을 바탕으로 김형준 CAIO와의 대화를 전한다. 이 인터뷰에서는 ‘버티컬’ 영역에서의 소형 LLM이 왜 중요한지, 그리고 기업의 법무팀이 굳이 왜, 이런 AI 솔루션을 필요로 하는 지 등을 확인할 수 있다.
학교에서부터 자연어처리(NLP)를 연구했다. 그런데 내가 취업할 때만 하더라도, 기업에서 진지하게 NLP를 하는 곳이 없었다. SK텔레콤과 네이버와 같은 대기업에서 일하면서, 좀 더 좁은 영역 혹은 진짜 가치 있는 영역에서 NLP가쓰일 수 있는 게 뭔지를 계속 고민했다. 예전에도 AI 시장이 본격화되면 법률이나 의료와 같은 버티컬 시장에서 수요가 있을 거라고 예상은 했지만, 챗GPT가 나오기 전에는 이게 이렇게 빨리 본격화될 거라곤 생각을 못했다. AI나 머신러닝(ML)이 새로운 시장 가치를 만들 수 있겠느냔 질문을 엄청나게 많이 받는다. 그런 질문이 예전에는 혹여 재미있는 장난감, 비싼 장난감이 아니겠느냐는 뉘앙스였는데, 분위기가 많이 달라졌다.
AI를 하다 보면 특정 도메인도 필요하고 데이터, AI 기술이라는 삼박자가 좀 잘 맞아야 되는데 보통 대기업에서는 다루는 영역이 워낙 많다 보니까 그런 특정 도메인을 하기가 조금 힘들더라. 대기업이 기술이나 엔지니어는 훨씬 많다. 그렇지만 진도가 안 나간다. 옛날부터 “법률이나 의료를 하면 될 것 같다”고 말을 하지만 실제로는 “뭘 해야 될 지 잘 모르겠다”는 거다. 기술은 알지만 법 전문가들이 뭘 원하는지, 어떤 걸 해줘야 하는지에 대해서 막힌다.
그런데 여기 와서는 토론(discussion)을 많이 하고 업도 많이 배우게 된다. 대기업에선 (회사 안에) 엔지니어와 법 전문가가 다 있어도 파트가 나뉘어 있어서 서로 뭘 해야 하는지 모르니까 그냥 데이터를 집어 넣어 인공지능을 트레이닝 시키면 된다고 하는데……
그런데 그렇지 않다. 그렇게 생각하고 만든 것들이 정확한 결과를 내놓지 않는다. “거짓(Hallucination)이 섞여 있다”고 말하면 “이거 원래 그렇다”고 답한다. 부정확한 답을 전문가가 쓰긴 어렵다. 그래서 진도가 계속 안 나가더라. 그런데 이런 걸 스타트업 같은 데서는 실질적으로 현장과 부딪히면서 만들어 가고, 그러다보니 새로운 비즈니스모델(BM)도 많이 발굴되는 것 같다. 예를 들어서 ‘AI 리뷰’는 대기업이 만든 기존 시스템에선 주지 못하는 가치(value)가 있다.
비밀유지 계약서와 같은 특수한 계약서에만 들어가는 유형의 조항들이 있다. 이런 걸 다 별도로 추출한다. 이전에는 그런 작업을 단편적으로 사람이 했는데, AI 리뷰에서는 인공지능이 분류, 추출하고 대시보드 형태로 종합적으로 보여준다. 재무나 영업에서는 이런 대시보드 통계나 그래프 분석이 있었지만 법무엔 없었다. 특정 계약서 조항 같은 걸 다각적으로 보여줄 수 있는 것에 대해 실무자들이 가치를 많이 평가하더라.
우연한 기회에 임정근 대표를 만나 이야기 했다. 법률 전문가인데도 AI 쪽에 관심이 많고 해박하더라. 그래도 이 회사가 법률이 메인이다 보니 처음에는 (AI 솔루션 개발이) 지속 가능할까, 혹시 그냥 AI를 한 번 ‘찍먹(체험삼아 한 번 해보는 것)’하는 것 아닐까 하는 고민도 했다. 그런데 얘기를 나눠 보니까 (임 대표가)업에 대한 사명감이 있고 기술적으로 지원하게 되면 시너지가 많이 날 거라고 생각이 들었다. 스타트업이 지금 되게 어려운 시기이지 않나. 하지만 법률이나 이런 버티컬 시장에서 AI가 정말 잘 할 수 있는 시점이라는 생각도 들었다. 비즈니스적 탄탄함, 성장 가능성을 보고 합류를 한 거다.
예를 들어서 제가 법무팀에 어떤 업무 자문을 요청한다고 생각해보자. 변호사가 하나부터 열까지 전부 다 보고 판단해 자문을 해야 하기 때문에 시간이 오래 걸린다. 현업의 담당자는 조금 더 빨리 그 결과를 받아야 될 수도 있는데, 변호사 입장에선 수많은 현업부서가 다 나한테 연락을 하고 기다리니 업무에 로드가 걸릴 수 있다. 결과적으로 변호사가 더 일을 잘 할 수 있도록, 거드는 그런 솔루션이 필요하다.
기업의 솔루션에 AI적으로만 접근하는 회사들이 많다. 그런데 법률과 같은 영역에서는 ‘정확도’를 추구해야 한다는 것이 어렵다. 챗봇이나 일반적인 대화에서는 사실 답이 딱 정해져 있지 않을 수 있다. 예를 들어서 “밥 먹어요?”라는 질문만 하더라도 “배 안고파요?”라거나 “뭐 먹을래?” 이런 다양한 변형이 있을 수 있다. 법률도 물론, 여러 변주는 있을 수 있겠지만 어느 정도 정확도를 담보해야 하는데, 그게 좀 어려움이 있는 것 같다.
구글 등과 같은 곳에서 오픈된 언어 모델을 만들지만, 이런 제품들은 통상 일반화된 대화나 신문 뉴스 같은 것에 포커싱이 되어 있다. 우리는 법령, 판례와 같은 공개된 데이터 외에도 계약서, 법률 자문, 송무와 같은 일에 관련된 서류에 집중되어 있다. 내부에 전문 변호사가 있고, 이들이 직접 만든 문서 등을 같이 버무려 (데이터 학습을 위한) 전처리를 했다. 수백만 건이 넘는 데이터를 직접 가공해 자체적으로 만든 거다. 또, 도메인이 한정되어 있으므로 검색 속도나 정확도가 높고 상대적으로 모델의 사이즈가 작아 비용 측면에서도 유리하다.
데이터 문제도 있지만, 회사에 따라서는 ‘프라이빗’하게 솔루션을 쓰려는 곳도 있다. 공공기관이나 금융권이 특히 그렇다. 계약서 자체도 민감한 데이터라 (공개를) 꺼리는 데도 있고. 우리 솔루션은 챗GPT와 같이 다양한 데이터를 가지고 테스트를 할 순 없지만 대신 법률 계약에 특화해 자료를 찾고 그 중에서 중요한 정보를 요약해준다. 또, 주요 판례나 법령을 체크하는 것 역시 지금 자체적으로 만들고 있다. 법률 사무소, 일반 기업의 법무팀에서도 모두 쓸 수 있다.
순서의 차이 같다. 대기업은, 조금 더 일반화된 문서들 – 예를 들어서 사내 문서나 메신저 같은 것- 에서 먼저 시작을 하는데 우리는 법률이나 계약에 특화해 시작을 했다. 나중에 성장을 하면 만날 수는 있겠지만, 우리는 법무와 관련한 필요한 부분을 먼저 선점하고 그걸 기반으로 데이터를 모으고 시장을 확장해나가는 플랜을 갖고 있다는 게 다르다. 각자 장단점이 있는데 잘 모르겠다(웃음). 법률이나 계약과 관련한 영역에서 원하는 수준을 대기업이 맞추는게 빠를지, 우리가 더 빠르게 클지는 아직은 미지수 같다.
전체 제품군과 통합 측면에서 차이가 있다. 사용자경험(UX)이나 기술 측면에서 되게 고민을 많이 하고 있다. 또, 우리는 공공이나 좀 더 큰 시장을 중점으로 보고 있기도 하다. 전체적인 사내 문서를 검색하는 것을 자체 LLM이나 이술로 어떻게 활용할 수 있을지도 같이 보고 있기도 하다. 정말 좀 자신 있다고 보는 것은 AI 엔진이 아예 프로덕트에 붙어 하나가 돼서 돌아가는 그런 솔루션을 개발하는 건 우리밖에 없다.
결이 달라서다. 에이닷과 같은 초거대 AI는 대화형으로 만들어졌고, BHSN 버트는 법무에 특화된 솔루션이다. 게다가 대기업에서도 중요하게 보는 ‘비식별화’를 BHSN이 매우 꼼꼼하게 보고 있다. 특히 생성AI를 하기 위해선 비식별화를 해야 하는데, 보통 거대 모델을 만들 때 실명이나 계좌번호, 전화번호 정도를 비식별화하지 기관명이나 금액 같은 것까지 하진 않는다. 우리는 이런 것까지 모두 비식별화한다. 대기업에서 법무만의 전처리를 위한 별도 팀을 꾸리기 어려운데 우리는 (그게 전문이니까) 엄청 많이 하고 있다.
일반적으로 많이 사용하는 라이센스 문제가 없는 공개된 문서와 더불어 BHSN 자체 법률 데이터도 활용하고 있다. 비식별화, 데이터 증강 기술을 이용해 양질의 데이터를 계속 생산할 수 있도록 자체 파이프라인을 구축하고 있다. 또한 기계와 사람이 동시에 계속 검수하고 있다.
공통된 포맷도 있지만 회사마다 (라벨링에 대한) 요구가 다를 수 있다. 법률도 다르고, 제약 회사도 쓰는 (용어나 문서 형식이) 다를 수 있다. 그렇기 때문에 우리는 튜닝을 할 수 있는 플랫폼도 만들어 놓고 있다. 공통 커버리지가 90%라도, 5%가 다르면 요구사항이 생길 수 있는 것 아닌가. 더불어 최대한 공통적인 요소를 많이 확보해 뼈대가 잘 작동하도록 데이터와 계약서의 종류를 늘리는 데 시간과 노력을 기울이고 있다.
대기업들과 이야기를 많이 나누고 있다. 지금은 기업의 요구에 따라 해당 기업의 자체 LLM을 구축하고 있는데, 앞으로는 BHSN이 가진 프로덕트 로드맵에 따라서 퍼블릭으로 솔루션을 공개하고 쓸 수 있도록 하는 기성형 모델을 염두에 두고 있다.
회사가 B2B를 중점으로 하고 있다. 그래서 전체 프로덕트의 품질이 중요하다. 전체로 보면 AI나 머신러닝(ML)이 작은 부분일 수 있겠지만, AI가 프로덕트의 핵심 가치를 담을 수도 있고 차별화하는 요소가 될 수도 있다. 회사의 폭발적인 성장 잠재력을 지닐 수도 있고. 그래서 개인적으로는 CAIO가 세 가지 역할을 해야 한다고 생각한다. 첫째는, 전체 프로젝트의 가치를 높일 수 있는 AI 기술 컴포넌트나 밸류를 개발하는 것이다. 예를 들어서 계약서 관리 시스템 자체는 개발쪽에서 만들지만, 계약서의 주요 조항을 추출하거나 비식별화하는 것은 AI의 영역이다. 개발과 AI, 각자의 역할이 있는 거다.
두번째로는 프로젝트에 들어가는 것 외에 AI 혼자(stand alone) 기능하는 것도 있다. 예를 들어서 챗GPT나 빙 서치, 네이버 하이퍼클로바엑스처럼 별도의 서비스가 제품으로 나올 수도 있으니 전략을 수립할 필요가 있다. 새로운 전략이나 방향을 만들어야 하니까 그렇다. 회사마다 전략이 다른데, 일반화된 모형을 먼저 만들지 도메인 특화한 것을 만들지를 결정하는 것도 모두 전략이다. 의사 결정에 따라 시간과 비용을 쓰는 형태가 엄청 달라진다. 기술을 다양하게 실험하고 무엇을 바꿀지, 어떻게 빨리갈지를 결정하는 전략을 세우는 것이 필요하다.
마지막으로, 한국어 뿐만 아니라 다국어 언어 모형도 개발하고자 방향을 잡고 있다. 버트나 LLM을 개발하는 노하우를 계속 쌓고 있다. 한국어 뿐만 아니라 영어, 일본어 등 글로벌 시장도 계속 이야기 하는데, 새로운 시장을 따라잡기 위한 전략을 계속 수립하는 데도 CAIO라는 직책이 필요한 이유라고 본다.
지금은 안 된다고 본다. 왜냐하면 결과적으로 누군가가 최종 검토 후 소견을 내야 되기 때문이다. (지금까지 나온) BHSN이 만든 모든 시스템의 AI가 자체적으로 판단하거나 추론하진 않는다. AI가 엄청 고도화가 되고 정말 정확도가 높은 답을 주겠지만 그럼에도 불구하고 결국은 전문가가 같이 붙어서 보면서 답을 주는 것이 현재로서는 지향하는 바이기도 하다. AI는 전문가가 (원하는 정보를) 빠르게 잘 찾을 수 있도록 정리해 도와주는 역할을 하는 것이다.
챗GPT를 만든 오픈AI 기술력으로도 정확도가 낮다고 생각한다. 왜냐면 법령이 계속 바뀌는 부분도 있고, 사람에 따라서도 이견이 있을 수 있는 부분도 있다. 그래서 그걸 판단하는 것은 (AI가 하기엔) 어렵다. AI가 사람이 잘 판단하도록 정보를 제공하는 쪽에 집중하고 있다.
법률 시장에서 AI를 어떻게 사용하고 가치를 만들 수 있을지, 이런 것을 특히 더 ‘테크’적으로 소개할 수 있는 자리가 있으면 좋겠다. 챗GPT가 좋긴 하지만 정확도 측면에서 아쉬운 부분도 있지 않나. BHSN이 보다 정확한 정보를 자체적으로 분류하는 ‘버트’ 같은 것을 만들고 있기 때문에, 이를 활용해 정확도를 높이는 방향을 많이 검토하고 있다. 이런 것이 가치를 어떻게 만들어 낼지를 계속 신경 쓰고 있기도 하다.
결과적으로는 법률 생성 AI 시장을 선도를 하고 싶고, 기술적으로 제품적으로 완성도 있는 솔루션을 계속 만들어 나가고 싶다. AI를 계속 해왔는데, 진짜 유용한 걸 만들고 싶다는 생각이 있다. 한 순간 지나가는 그런 게 아니라, 정말 우리 생활이나 비즈니스에 도움이 되는 그런 기술 말이다. 법률이 그렇다. 예를 들어 사람들이 계약을 할 때 계약서가 엄청 길지만, 그중에서도 내가 집중 해야 할 부분을 AI가 검토해주니까 확실히 도움이 되더라. 단순히 계약서 검토 문제를 넘어서, AI 시장 자체가 실수요자한테 도움이 많이 되는 방향으로 발전하도록 엔지니어들도 많이 노력하면 좋겠다.
남혜현 기자
※ 원문 기사 출처: 바이라인네트워크, <[바스리] 회사 법무팀에도 특화 AI가 필요한 이유>
ⓒ 바이라인네트워크 무단전재 & 재배포 금지