Search

Cochl.Labs 인터뷰 with Research Team

Tags
안녕하세요, Cochl에서 처음 선보이는 Cochl.Labs! Cochl.Labs가 어떻게 만들어졌는지 그 대장정을 여러분께 공개합니다. 그 시작으로 Cochl의 리서치팀 정수 님, 상민 님과 함께 인터뷰를 진행해봤습니다 :)

Q. Cochl.Labs와 본인에 대해 간단하게 소개 부탁드립니다.

정수 님: Cochl.Labs는 우리의 잠재 고객들이 우리 기술을 직접 경험해볼 수 있고, 들어볼 수 있는 사이트입니다. 맡은 직책이 리서치팀 리드다 보니 이번 Cochl.Labs 프로젝트에서는 백엔드와 프론트엔드를 이어주는 다리 역할을 했습니다. 아무래도 제가 기존에 만들었던 사이트(링크)를 바탕으로 Cochl.Labs가 개발되다 보니 분야를 넘나들며 도움을 드렸네요. 아 참고로 위 사이트는 Cochl.Labs로 연결해뒀습니다.
상민 님: Cochl.Labs는 회사에서 제공하는 서비스나 기술을 한눈에 경험해보실 수 있게 만든 페이지입니다. 정수 님께서 만드신 샘플 사이트(링크: 정수님의 샘플 사이트 제작기)를 토대로 만들어졌고, 기존 사이트에 있던 기능들을 한곳으로 모아야 했습니다. 저는 프로젝트에서 프론트에서 들어온 요청에 따라 필요한 모델을 호출하여 그 결과를 다시 프론트로 전달해주는 서버 애플리케이션과 API를 정의하는 것을 담당했습니다.

Q. 이번 Cochl.Labs는 어떻게 시작하게 되었나요?

정수 님: Cochl이 지금까지 만들어온 프로덕트는 API나 SDK라는 추상적인 소프트웨어의 형태를 띠고 있습니다. 그러다 보니 사람들이 우리 기술을 가져다가 경험해보고 솔루션을 성능평가 해보는 데에 있어 전문 개발자가 아니면 허들이 높았습니다. 어떻게 하면 이 허들을 낮출 수 있을까? 에 대한 고민으로부터 시작했어요.
한편으로는 아직 비즈니스적으로 packaging이 되진 않았지만 연구 개발이 완성된 다양한 기술을 보유하고 있어서 그런 기술력 또한 선보일 수 있는 자리가 있었으면 하는 희망도 있었습니다. 이 두 가지 고민을 바탕으로 사람들이 쉽게 접근해볼 수 있으며, 기술을 사용해볼 수 있는 웹페이지라는 형태의 Cochl.Labs가 탄생하게 되었습니다.
상민 님: 개인적인 이야기지만 다른 사람들에게 우리 회사를 소개하는 것이 쉽지 않더라고요. 저희가 할 수 있는 것은 그보다 훨씬 많은데도 불구하고 무형의 무언가를 만들다 보니 뭉뚱그려 소리 인식 인공지능을 만드는 회사야 정도로 밖에 설명하지 못했습니다. 그런 의미에서 직관적으로 우리가 하는 것들을 보여줄 수 있는 매체가 필요하다고 생각했습니다. Cochl.Labs가 일반인에게도 그렇고, 잠재 고객군에도 좋은 예시가 되어줄 수 있다고 봅니다.

Q. Cochl.Labs의 시작에는 개인적으로 느끼셨던 아쉬운 경험이 있었네요. 실제 서비스를 구현하기까지는 어떤 과정을 거치셨나요?

정수 님: 디자인팀, 개발팀과 기획 단계에서 긴밀하게 이야기하는 것부터 시작했습니다. 저희도 이런 문제를 풀고 싶은 바람이 있었고, 디자인팀의 지은님도 가지고 있었죠. 하지만 서로가 생각했던 컨셉과 방향이 달라 그 부분을 먼저 통일하는 것이 필요했습니다. 지은님께서 컨셉을 제안해주시면 회사의 전체적인 목표와 저희가 기술적으로 실현할 수 있는 부분을 기준으로 함께 방향성을 맞췄습니다. 그렇게 기획이 완료된 후 디자인팀에서 디자인 안을 공유하면, 개발팀과 리서치팀이 같이 구현해 나갔습니다.
상민 님: 리서치 팀에서는 기획할 때 리서치 측면에서 어떤 것들을 보여줄 수 있을지, 무엇을 보여줄 수 있을지, 어떤 옵션을 제공할지 등 세세한 부분에 많이 신경썼습니다. 처음 Cochl.Labs를 기획할 때는 성능이 완전하지 않아도, 우리가 가진 다채로움을 보여주자는 방향으로 갔으나 테스팅 단계까지 가보지 못한 기술들은 기술 자체의 신뢰성을 위해 검증한 후에 업데이트하는 것으로 방향을 전환했습니다. 가령 저희가 보유한 기술 중에 Machine anomaly detection 기술은 그 성능이 저희가 원하는 수준의 신뢰성에 아직 미치지 못한다고 생각하여 최종 서비스에서는 제외되었습니다. 그런 식으로 Cochl.Labs에 들어갈 콘텐츠를 하나씩 정리해 나갔어요.

Q. 리서치 팀으로서 이번 Cochl.Labs를 통해 어떤 점들을 보여주고 싶으셨나요?

정수 님: Cochl이 다양한 분야에서 좋은 기술력을 가지고 있다는 사실을 알리고 싶었습니다. 기술력이라고 하기엔 거창하지만 저희가 보유한 소리 분석 솔루션이라든지 혹은 음악을 들려줬을 때 어떤 음악인지 찾아주는 기능이라든지 소리와 관련되어 저희가 쌓아온 여러 가지 것들이요. Cochl.Labs 페이지를 찾는 사람들에게 우리가 이런 다양한 것들을 커버하고, 프로덕트화 할 예정이라는 것을 선보이고 싶었습니다. ‘Machine Listening’ 분야에 있어 Cochl이 가진 매력과 기술력을 눈도장 찍는 게 목표죠.
상민 님: 저도 정수 님과 같은 목적이었어요. Cochl.Sense라는 프로덕트가 저희의 주력 모델이긴 하지만 내부에서 잠재적으로 흥미가 느껴지는 것들에 대해 넓은 범위로 연구해오고 있고, 그 연구의 결과가 이것이다! 라고 소개해 드리는거죠. 우리가 해왔던 것과 할 수 있는 것들을 보여줄 수 있는 말하자면 ‘Cochl 기술 희망 편'?

Q. 가장 구현하기 어려웠던 experiment와 그 이유는 무엇인가요?

정수 님: 제 경우에는 Music identification experiment가 가장 힘들었습니다. 기본적으로 SK와 프로젝트 했던 엔진을 바탕으로 만든 건데, 리소스가 굉장히 많이 필요한 작업이었어요. 메모리도 많이 필요하고, 조그마한 컴퓨터에서 해당 엔진을 돌리기가 어려웠기도 했고, 데이터베이스 구축도 쉽지 않은 문제였습니다. 지금 Cochl.Labs 페이지에 올라가 있는 Music identification experiment의 경우 성능적으로 더 개선할 수 있었지만, 성능과 컴퓨터 사이즈의 trade off를 고려해서 적절한 세팅을 맞춰놓은 상황입니다. 여러 의미에서 기술 개발에 많은 힘을 주어야 했기에 가장 구현하기 어려웠네요.
상민 님: 모델 성능과 관련된 건 아니지만 마지막에 custom event selection 부분에 있어 버그를 발견했어요. 한 번에 여러 특성을 분석하다 보니 API 관점에서 넘어와야 할 파라미터가 많다 보니 버그가 난 게 아니었을까 추측했습니다. 처음에는 원래 이런 건가? 하고 생각했다가 원래 그럴 리가 없잖아! 라는 생각에 하나하나씩 다시 뜯어보며 버그를 잡았네요. 다행히 지금은 버그픽스가 완료된 상황입니다.

Q. 그럼 가장 애착이 가는, 사람들에게 추천하고 싶은 experiment는 무엇일까요?

상민 님: 제 주변 사람들은 Music content analysis를 좋아했어요. 주변 친구 중 음악을 좋아하는 친구들이 많기도 하고, 본인들이 생각하기에 꽤 정확하게 분석 결과가 나오는 것 같다고 말해주더라고요. 음악의 장르, 분위기, 빠르기 등의 정보를 알 수 있는데 그런 부분을 재미있어하는 것 같았습니다. 특히나 Music과 관련된 3개의 실험의 경우 ‘너희 회사에서 이런 것도 만들어?’ 등의 반응도 끌어냈죠.
정수 님: 저는 Sound event detection을 가장 추천합니다. 결과적으로 저희의 기술을 가 장 잘 드러낼 수 있는 메인 프로덕트니까요. 특히나 Cochl.Labs를 통해 경험할 수 있는 Sound event detection은 잠재 고객들이 저희의 서비스를 도입할지 말지 결정을 내리는 데 있어서 많은 도움을 줄 수 있으리라고 봅니다. 최대한 사람들이 쉽고 간편하게 써볼 수 있도록 만들어놨어요. 원래는 20가지의 클래스의 소리를 분석할 수 있지만, Cochl.Labs에는 10가지만 오픈해둔 상황입니다. 10가지 클래스를 경험해보고, 더 많은 클래스를 경험하고 싶으시다면 대시보드에 가입해보는 것도 추천해 드립니다.

Q. Cochl의 리서치 팀만이 가진 특별한 점은 무엇일까요?

정수 님: 소리 관련된 서비스를 한다는 것이 가장 특별한 점이라고 봅니다. 소리를 다루고 있고, 오디오 데이터는 오디오 품질에 따라 다르지만, 일반적인 음질의 경우 초당 44,100개의 실수(숫자)로 이루어져 있어서 데이터 사이즈가 큰 편입니다. 똑같은 소리라도 거리가 가까울 때와 멀 때 소리의 특성이 다르고, 가령 사이렌 소리의 경우 정차 시와 움직일 때 다릅니다. 다양한 종류의 소리가 어떤 건 하나의 카테고리로 합쳐지고 어떤 건 다른 카테고리로 가는 경우가 많아요. 눈에 보이지 않는 것과 싸워야 해서 모든 분야가 그렇지만 제게는 특히나 더 어렵습니다. 본인이 약간 어려운 환경에서 도전하는 것을 좋아하는 모험심이 있으시다면 좋아하실 거예요.
상민 님: 사실 연구는 어디서나 할 수 있어요. ‘어떤' 연구를 ‘어떻게' 하는지가 제게는 중요합니다. 개인적으로 저는 동기 부여가 중요한 사람이라, 소리 분석을 한다는 것 자체가 가장 마음에 와닿았습니다. 우리의 일상에 존재하고, 영향을 주는 것에 관한 연구잖아요. 그래서 정수 님께서 말씀하신 것처럼 어려운 상황들이 많아도 이겨낼 수 있는 것 같습니다. 그리고 흔하게 사용되는 표현이지만 Cochl의 일하는 방식은 ‘자율'과 ‘책임'이에요. 본인이 연구하고, 본인이 결과를 만들어 나갑니다. 그런 것들이 맞는 분들에게는 아주 특별한 최고의 팀이 될 수 있겠죠.

Q. 현재 리서치 팀이 가장 집중하고 있는 것은 무엇인가요?

정수 님: 너무 많아서 추리기가 어렵네요. 저희는 Machine anomaly detection처럼 어떤 특수한 상황에 대해 고객의 수요가 있다면 그런 모델을 개발해, 보유하고 있는 Sound event detection 모델에 추가하고, 학습해서 프로덕트화 하는 작업을 계속해 나가고 있습니다. 그래서 우선은 지금 가지고 있는 Cochl.Sense에 있는 20개의 클래스 외에 더 다양한 소리를 커버할 수 있는 게 최우선 작업이에요.
또 Cochl.Labs를 통해 저희 기술을 경험해보신 분들이 저희 기술을 써보고 싶다, 적용해보고 싶다고 했을 때 사용할 수 있는 레퍼런스 하드웨어까지 만들어 plug and play 할 수 있도록 만들어 놓는 작업도 진행 중입니다. 계속해서 기술과 클라이언트 간의 허들을 낮추는 작업을 하고 있다고 정리할 수 있네요.
상민 님: 병렬적으로 다양한 주제를 연구하고 있는데, 우선 저는 정수님이 말씀하신 레퍼런스 디바이스를 만드는 일에 집중하고 있어요. 이건 코클랩스의 다음 단계라고 볼 수 있습니다. 저희 기술의 가능성을 컴퓨터 앞에서 확인한 클라이언트들이 실제 구동 환경에서도 설치 및 테스트 해볼 수 있게 도와주는 매개체 거든요. 이렇게 저희와 클라이언트 사이의 장벽이 사라질수록 우리 기술이 더 많은 사람들에게 어필할 수 있다고 생각해요.

Q. 혹시 앞으로 우리의 기술을 외부에 알리기 위해 해보고 싶은 것들이 있으실까요?

정수 님: 주어진 데이터 세트에서 훌륭한 알고리즘을 만들어 논문을 쓰는 것 이상으로 실제 프로덕트로 만들기 위해선 많은 테스트를 거쳐야 합니다. 그런 수준 높은 테스팅을 통해 개발된 최적의 모델을 개발팀에 전달해야 하는 것이 저희 리서치팀의 역할이고요. 리서치 팀 내에서 어떤 모델이 정말 우리의 최종 모델이 되어야 하는가에 대한 치열한 고민을 Cochl의 리서치 팀은 매일하고 있습니다. 그런 과정을 다른 리서쳐 분들께 공유해볼 수 있으면 좋겠네요. 실제 테스팅은 논문의 테스팅과는 어떻게 다른지 등의 주제를 통해서 말이죠.
상민 님: 예전부터 관심이 있었던 행사가 하나 있는데 ‘뮤직 해커톤'이라는 행사에요. 음악이라는 공통 주제를 바탕으로 음악 관련 애플리케이션을 만든다거나, 하드웨어 디바이스등을 만들고 참가자끼리 즐기는 모습이 아주 좋더라고요. 소리 관련된 주제로 해커톤을 하거나 행사를 진행하면 어떨까는 생각했어요. 만약 소리가 너무 광범위한 주제라면 ‘음악'도 좋고요!
 Cochl의 리서치팀이 하고 있는 일이나 기술에 관심이 있다면 저희는 열려있으니 편하게
contact@cochl.ai 로 연락 주세요!