본문 바로가기
기타

'모델에 구애받지 않는 AI 구축'… 로켓모기지의 AI 접근법

by K-Books 2024. 4. 17.
728x90

머신러닝과 AI를 적극적으로 활용해 온 미국 모기지 대출 기업 로켓모기지(Rocket Mortgage)는 최적화된 다목적 데이터 플랫폼을 바탕으로 모델에 구애받지 않는 생성형 AI 접근 방식을 취하고 있다.
 

ⓒ Getty Images Bank
모기지 업계의 성공은 효율성, 정확성과 직결된다. 다양한 옵션을 열어두는 것도 중요하다. 로켓모기지가 머신러닝과 AI 기술을 적극적으로 도입해 온 이유다. CIO 브라이언 우드링은 한 가지 AI 모델에 국한되지 않고 '사람을 중심으로 하는' AI 전략을 강조하고 있다.

로켓모기지는 10년 이상 동안 머신러닝과 AI를 활용해 왔으며, 생성형 AI 기능을 시장에 내놓은 몇 안 되는 기업 중 하나다.

CIO 우드링은 "현재 약 1년 동안 여러 생성형 AI 사례를 개발 중이다. 이를테면 말하는 것뿐만 아니라 듣고 이해하도록 설계된 생성형 AI 챗봇이 있다"라고 말했다.

로켓이 개발한 또 다른 생성형 AI 어시스턴트는 지원자의 회사명을 분석하는 기능을 지원한다. 이는 모기업 내의 다양한 회사명이 입력돼도 하나의 이름으로 인식해 의사 결정 과정을 크게 단축시킬 수 있다. 예를 들어 대부분의 사람은 구글과 알파벳이 같은 기업이라는 것을 알고 있다. 우드링은 이런 인간 지식을 활용해 회사명을 분석하도록 생성형 AI 어시스턴트를 학습시키는 것이 모기업 데이터베이스를 구축해 자회사나 회사 신원을 교차 확인하는 것보다 훨씬 효율적이라고 말했다.

우드링은 로켓모기지가 생성형 AI를 생산에 도입한 초기에, 투자자와 규제 당국에 안전하고 책임감 있는 방식으로 기술을 구현했다고 확신을 주기 위해 적절한 보호 장치와 가이드라인을 마련한 상태라고 언급했다. 이제는 자체 개발한 코드와 AI로 완전히 자동화된 여러 비즈니스 프로세스를 보유하고 있다. 하지만 모기지 대출 승인 여부와 같이 생성형 AI 애플리케이션에 결정이 필요할 때는 항상 '사람'이 개입하고 있다.

우드링은 "로켓도 이를 구축 중이지만, 생성형 AI 기반 코파일럿이나 시스템은 수년간 인터넷에 올라온 모든 정보를 학습한 모델과 인간의 판단을 결합했을 때 결정의 정확도가 10%에서 15%까지 높아질 수 있다. 이는 엄청난 수준이다"라고 말했다.

분석가들 역시 생성형 AI 프로세스의 결정과 결과를 승인하는 데 사람의 의견을 반영하는 것이 초기 생성형 AI의 필수 동력이라고 언급했다.

IDC의 AI 및 자동화 시장 조사 및 자문 서비스 그룹 부사장인 리투 조티는 "생성형 AI는 여러 데이터 포인트를 연결하고 몇 초 만에 인사이트를 요약 및 종합하는 가상 지식 근로자가 되고, 사람이 고부가가치 작업에 더 집중할 수 있게 해준다"라고 말했다. 그는 "대출 심사 같은 프로세스가 혁신되고 있지만, 아직 초기 단계인 만큼 100%의 정확도를 보장할 수 있어야 진정한 효과와 실행 가능성을 확보할 수 있다. 따라서 '휴먼 인 더 루프'가 중요하다"라고 덧붙였다.

모델에 구애받지 않는 AI 구축
로켓은 현재 1,000명 이상의 엔지니어와 600여 명의 데이터 과학자를 고용해 대부분의 코드를 자체적으로 구축하고 있다. 이는 로켓이 모기지 대출 기관인 동시에 엔지니어링 회사로서 얻을 수 있는 이점이다.

우드링은 2017년 제품 엔지니어링팀의 CTO로 입사했다. 당시 최우선 과제는 회사의 클라우드 도입을 가속화하는 것이었다. 그는 "입사 후 6개월이 되기 전에 앞으로 모든 새로운 기술을 클라우드에 구축하겠다고 선언했다. 이것이 가장 먼저 한 일이었다"라고 말했다.

현재 로켓의 워크로드는 60~70%가 클라우드에서 실행되며, 그 중 95% 이상이 AWS에서 실행되고 있다. 나머지는 온프레미스에서 실행된다.

우드링에 따르면 회사의 첫 머신러닝 모델은 마케팅, 리드 생성 패턴 인식, 대출 개시 프로세스 등의 작업을 자동화하기 위해 10년 전 개발됐다. 하지만 그에 따르면 지난 5~6년 동안 로켓의 AI 사용이 '과열 양상'을 보이기 시작했다. 예를 들면 현재 대출 신청자 소득 확인의 3분의 2가 머신러닝 모델과 AI 기술로 100% 수행되고 있다.

우드링은 "이제 비즈니스의 거의 모든 측면에 ML 또는 AI, 작업 자동화, 패턴 인식, 데이터 분석이 적용되고 있다"라면서, 의사 결정이 필요할 때는 항상 사람이 마감 프로세스에 참여한다고 강조했다.

로켓의 엔지니어와 데이터 과학자들은 생성형 AI 모델 개발에 AWS 베드록과 AI 기술을 사용하고 있다. 주로 AWS를 사용하지만 생성형 AI 플랫폼에 대해서는 모델에 구애받지 않는 접근 방식을 택하고 있다. 마이크로소프트 출신 기술 임원인 바룬 크리슈나가 AWS, 앤트로픽, 오픈AI, 구글, 미스트럴 등 모든 AI 기반 모델 제공업체와 직접적인 관계를 맺고 있다고 우드링은 설명했다.

우드링은 "앞으로 어떤 일이 일어날지 알기 위해 이들 모두와 직접 협력하려 하고 있다. 앞으로 여러 사용 사례에 맞게 조정된 다양한 AI 모델이 등장할 가능성이 높다. 적시에 적절한 모델을 연결하려는 중요한 전략이다"라며 복잡한 AI 경쟁에서 확실한 '승자'는 없을 것이라고 지적했다.

우드링은 AWS 베드록이 데이터를 올바른 AI 모델로 '매우 빠르게' 가져올 수 있도록 로켓의 표준 데이터 플랫폼을 구축한다는 데 이점이 있다고 언급했다. 또 다른 경우에는 로켓이 AI 모델을 테스트하고 "여러 업무에서 효율성을 확인할 것"이라고 말했다.

그는 AWS와 로켓이 비슷한 사고방식을 갖고 있다면서 "유일한 승자가 되는 것에 집착하지 않는 태도"라고 말했다. 이는 특정 업무에 적합한 AI 모델을 선택한다는 로켓의 전략과 일맥상통한다고 그는 덧붙였다.

데이터 운영 현대화
대부분의 IT 리더는 AI 모델의 품질이 관련 데이터의 품질과 데이터베이스, 데이터 웨어하우스, 클라우드 데이터 레이크 등에서 대규모 언어 모델에 데이터를 주입하는 방식이 중요하다는 사실을 알고 있다.

로켓의 AI 전략에서 가장 중요한 것도 데이터다. 이를 위해 10년 이상 온프레미스 데이터 웨어하우스에 저장한 10,000테라바이트의 데이터와 AWS 클라우드 레이크에 저장된 반정형 데이터를 통합하는 최신 데이터 플랫폼을 구축하는 것을 핵심으로 삼고 있다. 대부분 기업처럼 로켓도 여전히 사용 중인 구형 기술 때문에 일부 자체 데이터센터를 운영하고 있다.

로켓은 데이터 레이크 전략을 의미론과 분류 체계를 갖춘 정형, 반정형, 비정형 데이터를 지원하는 AWS 데이터 플랫폼으로 발전시키고 있다. 또한 사람과 소프트웨어가 더 쉽게 검색하고 사용하도록 플랫폼 위에 API를 추가하고 있다.

이렇게 하면 AI 모델이 가장 잘 수집할 수 있는 리포지토리로 데이터를 밀어넣을 수 있다. 우드링은 로켓의 데이터 전체를 정리하는 것이 불필요하고 번거로운 일이며, 차세대 애플리케이션을 배포하는 프로세스를 지연시킬 수 있다고 말했다.

우드링은 "로켓은 데이터 기반 비즈니스이며, 실제로 모기지 대출은 데이터 처리 비즈니스에 가깝다"라고 말했다. 그는 로켓의 생성형 AI 엔진과 차세대 데이터 플랫폼이 모든 형태의 데이터를 특정 업무에 맞게 큐레이션하고 적절한 형식으로 신속하게 제공해 포트폴리오를 발전시킬 수 있도록 설계됐다고 설명했다.

그는 팀과의 약간의 시간만 있으면 누구나 할 수 있다며 "로켓은 빠르게 움직여 아이디어를 가장 먼저 시장에 내놓는 것을 중요하게 여긴다"라고 말했다.

 

출처 : ciokr@idg.co.kr

728x90