본문 바로가기
기타

“소프트웨어 엔지니어 위협할 수도” 새 AI 개발자 비서 ‘데빈’에 쏠리는 관심

by K-Books 2024. 3. 15.
728x90
반응형

데빈(Devin)은 개발자와 적극적으로 협업할 수 있는 능력을 갖춘 AI 비서다. 실시간 진행 상황 업데이트 제공, 피드백 수락, 설계 시 공동 작업 등의 재주를 부린다.

샌프란시스코에 본사를 둔 스타트업인 코그니션 AI(Cognition AI)는 새로운 AI 어시스턴트 데빈이 소프트웨어 엔지니어링 환경을 완전히 바꿀 수 있다고 기대한다.

이 AI 어시스턴트는 복잡한 엔지니어링 작업을 계획하고 실행할 수 있으며, 경험을 통해 학습하고 그 과정에서 실수를 바로잡을 수 있다. 셸, 코드 편집기, 브라우저와 같은 필수 개발자 도구를 갖춘 데빈은 샌드박스 컴퓨팅 환경 내에서 작동하며, 인간 개발자의 설정을 미러링한다.

코그니션 AI는 블로그 게시물에서 데빈의 특징에 대해 소프트웨어 개발 과정에서 사용자와 적극적으로 협업할 수 있다는 점이라고 설명했다. 여기에는 실시간 진행 상황 업데이트 제공, 피드백 수용, 디자인 선택을 위한 공동 작업 등이 포함된다. 전반적으로 데빈은 소프트웨어 개발 프로세스에서 원활한 파트너 역할을 한다고 회사는 주장했다.

데빈의 기능은 다양하다. 익숙하지 않은 기술을 학습하고, 앱을 엔드투엔드 방식으로 구축 및 배포하고, 코드 기반 버그를 자율적으로 찾아 수정한다. 또 AI 모델을 학습 및 미세 조정하고, 오픈소스 저장소의 버그 및 기능 요청을 해결하고, 성숙한 프로덕션 저장소에 기여할 수 있다. 인터넷 스카우트 기능을 통해 교육 리소스에 빠르게 액세스할 수 있어 복잡한 작업을 효율적으로 처리하기도 한다.

회사에 따르면 데빈의 이러한 기능성은 실제 업무에 적용되고 있다. 업워크에서 과제를 성공적으로 완료한 바 있다. 이 과제는 컴퓨터 비전 기술을 기반으로 추론하여 손상된 도로를 평가하는 것이었다.

성능과 관련해 데빈은 SWE 벤치 벤치마크에서 탁월한 것으로 평가됐다. 실제 깃허브 문제를 해결하는 과제에서 13.86%의 엔드투엔드 해결률을 기록했다. 이전 벤치마크의 1.96%를 크게 뛰어넘는 수치다. 편집할 정확한 파일이 주어진 경우에도 이전 모델은 4.80%의 문제만 해결할 수 있었다고 코그니션 AI는 블로그 게시물에서 밝혔다.

코그니션의 설립자이자 CEO인 스콧 우는 블룸버그와의 인터뷰에서 AI를 프로그래머로 교육하는 것이 얼마나 복잡한 일인지 설명했다. 그는 소프트웨어 엔지니어링 프로젝트의 여러 단계를 처리할 수 있는 데빈의 고급 추론 및 계획 능력을 강조했다.

AI 제공업체와 사용자에 대한 의미 있는 결과
데빈의 역량을 둘러싼 흥분에도 불구하고 업계 내에서는 신중해야 한다는 목소리도 있다. 구글의 수석 디렉터인 야리브 아단은 링크드인에서 “매우 흥미롭다"면서도 공급자와 사용자 모두에게 중대한 결과를 초래할 것이라고 언급했다. 

오픈시(OpenSea)의 공동 창립자이자 전 CTO인 알렉스 아탈라는 X에 올린 게시물에서 데빈에 대해 실제 사람처럼 느껴지는 최초의 AI 에이전트라고 표현했다. 그는 상태 업데이트를 제공하고 작업에 대한 가시성을 제공하며 사용자에게 제공하는 독특한 경험을 강조하면서 데빈의 능력을 높이 평가했다.

테크아크의 수석 애널리스트이자 설립자인 파이살 카우사는 "데빈은 소프트웨어 개발 주기에서 직면하는 문제와 과제를 구조적으로 해결하려는 독특하고 새로운 시도이다. 시장 출시 기간을 단축하는 동시에 버그 없는 알파 버전을 개발하여 단기간에 안정적인 애플리케이션을 출시할 수 있다"라고 평했다.

진화하는 소프트웨어 엔지니어의 역할
데빈의 등장은 프롬프트 투 액션 엔지니어링(prompt-to-action engineering )으로의 전환을 의미하며, 기존 소프트웨어 엔지니어의 역할에 영향을 미칠 수 있다. 이는 특정 하위 수준의 엔지니어링 일자리를 없애는 결과를 초래할 수도 있다. 동시에 AI 산업의 진화를 의미하기도 한다.

AI 기반 기술이 계속 발전함에 따라 소프트웨어 개발에서 데빈과 같은 AI 비서의 역할이 점점 더 중요해질 것이다.

현재 데빈은 비공개 상태이며, 일부 고객만 접근할 수 있다. 벤처비트의 보고서에 따르면 회사는 향후 코딩을 넘어 다양한 분야의 AI 에이전트 개발로 비전을 확장하여 접근성을 확대할 계획이다.

 

Cognition emerges from stealth to launch AI software engineer Devin

In the SWE-bench test, Devin was able to correctly resolve 13.86% of GitHub issues without any assistance, performing far better than GPT-4.

venturebeat.com

 

출처 : ciokorea, by Sandeep Budki  |  InfoWorld

728x90
반응형