오드아이, AI 보컬 신디사이저 ‘복스 팩토리’ 출시… “허밍만으로 보컬 제작”

Published: (May 14, 2026 at 09:58 PM EDT)
20 min read

Source: VentureSquare

  • MIDI 없이 녹음 한 번으로 멜로디·AI 보컬 생성 가능

  • 웹 기반 SaaS 환경으로 다국어 창작·협업 효율 강화

생성형 AI가 음악 제작 영역까지 빠르게 확장되면서 AI 기반 보컬 제작 시장도 본격 성장하고 있다. 단순 음성 합성을 넘어 실제 창작 workflow 안에서 작곡·가이드 제작·버추얼 콘텐츠 제작까지 연결하는 ‘실전형 AI 창작 도구’ 경쟁이 치열해지고 있다.

보이스 AI 솔루션 기업 오드아이(AudAi)는 15일 AI 보컬 신디사이저 서비스 ‘복스 팩토리(VOX Factory)’를 정식 출시했다.

복스 팩토리는 웹 기반 AI 보컬 신디사이저 서비스다. 한국어·영어·일본어 등 다국어 생성 환경과 다양한 보컬 캐릭터를 지원하며, 작곡가와 프로듀서, 버추얼 콘텐츠 제작자 등 1인 창작자가 아이디어를 빠르게 결과물로 연결할 수 있도록 설계된 것이 특징이다.

오드아이, AI 보컬 신디사이저 ‘복스 팩토리’ 출시 (사진 제공: 오드아이)

허밍만으로 멜로디 시작… 목소리만 넣으면 AI가 보컬 완성

복스 팩토리의 핵심 기능은 ‘스타트 프롬 보이스(Start From Voice)’다. 기존 보컬 신디사이저처럼 MIDI 데이터를 먼저 입력하는 방식이 아니라, 사용자가 허밍이나 간단한 가이드 녹음을 하면 AI가 이를 기반으로 멜로디 작업을 이어갈 수 있도록 구성됐다.

함께 공개된 ‘스마트 컨트롤(Smart Control)’ 기능도 눈길을 끈다. 기존 보컬 신디사이저들이 다수의 세부 파라미터를 요구했던 것과 달리, 복스 팩토리는 4개 핵심 파라미터만으로 감정선과 표현을 조절할 수 있도록 설계했다. 회사 측은 이를 통해 전문 프로듀서뿐 아니라 초보 창작자도 보다 쉽게 AI 보컬 제작 환경에 접근할 수 있다고 설명했다.

오드아이는 저작권 안정성 확보에도 집중했다. 복스 팩토리에서 제공되는 모든 보이스 IP는 음성권 확보를 완료한 자산으로, 창작자는 별도의 권리 문제 없이 상업적으로 활용할 수 있다.

서비스는 웹 기반 SaaS 형태로 제공된다. 별도 프로그램 설치 없이 클라우드 환경에서 작업할 수 있으며, 프로젝트 기반 협업과 다국어 콘텐츠 제작도 지원한다.

최근 글로벌 음악 산업에서는 생성형 AI를 활용한 보컬 제작과 음성 합성 기술 경쟁이 빠르게 확대되고 있다. 다만 음성권과 저작권 문제, 실제 제작 workflow와의 연결성은 여전히 핵심 과제로 꼽힌다. 업계에서는 향후 AI 음악 시장 경쟁력이 단순 생성 기술보다 창작 편의성과 IP 안정성, 실제 콘텐츠 제작 현장 적용성에서 갈릴 것으로 보고 있다.

오드아이 최순범 대표는 “AI 음악 시장이 커질수록 중요한 것은 단순 생성이 아니라 지속가능한 창작 생태계를 만드는 것”이라며 “복스 팩토리는 전문 보컬 녹음 환경 없이도 다양한 스타일의 멜로디와 보컬 작업을 빠르게 구현할 수 있는 창작 인프라가 될 것”이라고 말했다.

오드아이는 KAIST 음악·오디오 컴퓨팅 연구실 출신 인력을 중심으로 설립된 보이스 AI 기업이다. 조수미 듀엣 공연과 박새별 협업 프로젝트 등을 진행했으며, 현재 차세대 음성 편집 솔루션 ‘글루언트(Gluent)’ 출시도 준비 중이다.

Odd-Eye Launches AI Vox Factory Vox Vox… “Produces Vocals with Just Humming”

As generative AI rapidly expands into the realm of music production, the AI-based vocal production market is also experiencing full-scale growth. Competition is intensifying for “practical AI creative tools” that go beyond simple speech synthesis to connect composition, guide production, and virtual content creation within an actual creative workflow.

Voice AI solution company AudiAi officially launched its AI vocal synthesizer service ‘VOX Factory’ on the 15th.

Vox Factory is a web-based AI vocal synthesizer service. It supports a multilingual generation environment including Korean, English, and Japanese, as well as various vocal characters. It is designed to enable individual creators, such as composers, producers, and virtual content creators, to quickly turn their ideas into results.

OddEye Launches AI Vox Factory Vox Synthesizer (Photo courtesy of OddEye)

Melody starts with just humming… Just add your voice and AI completes the vocals.

The core feature of Vox Factory is ‘Start From Voice.’ Unlike traditional vocal synthesizers that require MIDI data input first, it is designed so that if the user records humming or a simple guide note, the AI can continue working on the melody based on it.

The ‘Smart Control’ feature, unveiled alongside it, is also drawing attention. Unlike existing vocal synthesizers that required numerous detailed parameters, Vox Factory is designed to allow users to control emotional nuances and expressions using only four core parameters. The company explained that this enables not only professional producers but also novice creators to more easily access the AI vocal production environment.

Odd Eye also focused on securing copyright stability. All voice IP provided by Vox Factory are assets for which voice rights have been secured, allowing creators to utilize them commercially without any separate rights issues.

The service is provided as a web-based SaaS. Users can work in a cloud environment without installing separate programs, and it supports project-based collaboration and multilingual content creation.

Recently, competition in vocal production and speech synthesis technologies utilizing generative AI has been rapidly expanding within the global music industry. However, issues regarding voice rights and copyright, as well as connectivity with actual production workflows, remain key challenges. The industry anticipates that future competitiveness in the AI music market will be determined not by simple generation technology, but by creative convenience, IP stability, and applicability in actual content production settings.

Choi Soon-bum, CEO of Odd Eye, stated, “As the AI music market grows, what is important is not simple generation, but building a sustainable creative ecosystem,” adding, “Vox Factory will become a creative infrastructure capable of rapidly realizing various styles of melodies and vocal work without the need for a professional vocal recording environment.”

Odd Eye is a voice AI company founded by personnel from the Music and Audio Computing Lab at KAIST. It has conducted pr

ojects such as the Sumi Jo duet performance and the Saebyul Park collaboration, and is currently preparing to launch the next-generation voice editing solution ‘Gluent’.

オードアイ、AIボーカルシンセサイザー「ボックスファクトリー」発売… 「ハミングだけでボーカル制作」

生成型AIが音楽制作領域まで急速に拡大し、AIベースのボーカル制作市場も本格成長している。単純な音声合成を超えて、実際の創作ワークフローの中から作曲・ガイド制作・バーチャルコンテンツ制作まで連結する「実践型AI創作ツール」の競争が激しくなっている。

ボイスAIソリューション企業オードアイ(AudAi)は15日、AIボーカルシンセサイザーサービス「ボックスファクトリー(VOX Factory)」を正式発売した。

ボックスファクトリーはウェブベースのAIボーカルシンセサイザーサービスだ。韓国語・英語・日本語など多言語生成環境と多様なボーカルキャラクターを支援し、作曲家やプロデューサー、バーチャルコンテンツ制作者など1人創作者がアイデアを素早く結果物につなげるように設計されたのが特徴だ。

オードアイ、AIボーカルシンセサイザー「ボックスファクトリー」発売(写真提供:オードアイ)

ハミングだけでメロディースタート…声だけ入れるとAIがボーカル完成

ボックスファクトリーの核心機能は「スタート・プロム・ボイス(Start From Voice)」だ。既存のボーカルシンセサイザーのようにMIDIデータを先に入力する方式ではなく、ユーザーがハミングや簡単なガイド録音をすればAIがこれに基づいてメロディー作業を続けることができるように構成された。

一緒に公開された「スマートコントロール(Smart Control)」機能も注目を集める。従来のボーカルシンセサイザーが多数の詳細パラメータを要求したのとは異なり、ボックスファクトリーは4つのコアパラメータだけで感情線と表現を調節できるように設計した。会社側はこれを通じて専門プロデューサーだけでなく初心者創作者もより容易にAIボーカル制作環境に接近できると説明した。

オードアイは著作権の安定性確保にも集中した。ボックスファクトリーで提供されるすべてのボイスIPは音声権確保を完了した資産であり、創作者は別途の権利の問題なく商業的に活用することができる。

サービスはWebベースのSaaS形式で提供されます。別途プログラムをインストールせずにクラウド環境で作業することができ、プロジェクトベースのコラボレーションや多言語コンテンツの制作も支援する。

最近、グローバル音楽産業では、生成型AIを活用したボーカル製作と音声合成技術の競争が急速に拡大している。ただし、音声権と著作権問題、実際の制作ワークフローとの接続性は依然として重要な課題に挙げられる。業界では今後のAI音楽市場競争力が単純生成技術より創作の利便性とIP安定性、実際のコンテンツ制作現場の適用性から分かれると見ている。

オードアイのチェ・スンボム代表は「AI音楽市場が大きくなるほど重要なのは単純生成ではなく持続可能な創作生態系を作ること」とし「ボックスファクトリーはプロのボーカル録音環境なしでも多様なスタイルのメロディーとボーカル作業を迅速に具現できる創作インフラになるだろう」と話した。

オードアイはKAIST音楽・オーディオコンピューティング研究室出身の人材を中心に設立されたボイスAI企業だ。チョ・スミのデュエット公演とコウモリ別のコラボレーションプロジェクトなどを行っており、現在、次世代音声編集ソリューション「グルアント(Gluent)」の発売も準備中だ。

Odd-Eye推出AI人声合成器Vox Vox……“只需哼唱即可生成人声”

随着生成式人工智能迅速扩展到音乐制作领域,基于人工智能的人声制作市场也正经历着全面增长。超越简单语音合成,将作曲、指导制作和虚拟内容创作整合到实际创作工作流程中的“实用人工智能创意工具”之间的竞争日益激烈。

语音AI解决方案公司AudiAi于15日正式推出其AI语音合成服务“VOX Factory”。

Vox Factory 是一款基于网页的 AI 语音合成服务。它支持包括韩语、英语和日语在内的多语言生成环境,以及各种不同的语音角色。其设计旨在帮助作曲家、制作人和虚拟内容创作者等个人创作者快速将他们的创意转化为成果。

OddEye推出AI Vox Factory人声合成器(图片由OddEye提供)

旋律从哼唱开始……只需加入你的声音,人工智能就会完成人声部分。

Vox Factory 的核心功能是“从人声开始”。与需要先输入 MIDI 数据的传统人声合成器不同,它的设计理念是,如果用户录制哼唱或简单的引导音符,AI 就可以在此基础上继续创作旋律。

与 Vox Factory 同时发布的“智能控制”功能也备受关注。与现有的需要众多详细参数的人声合成器不同,Vox Factory 旨在让用户仅使用四个核心参数即可控制情感细微差别和表情。该公司解释说,这不仅使专业制作人能够轻松上手,也让新手创作者能够更轻松地使用 AI 人声制作环境。

Odd Eye 还致力于确保版权稳定性。Vox Factory 提供的所有语音 IP 均已获得语音版权保护,创作者可以将其用于商业用途,而无需担心任何其他版权问题。

该服务以基于网络的SaaS形式提供。用户无需安装任何单独的程序即可在云环境中工作,并且支持基于项目的协作和多语言内容创建。

近年来,利用生成式人工智能进行人声制作和语音合成技术的竞争在全球音乐产业中迅速加剧。然而,语音版权问题以及与实际制作流程的衔接仍然是关键挑战。业界预计,未来人工智能音乐市场的竞争力将不再取决于简单的生成技术,而是取决于创作的便捷性、知识产权的稳定性以及在实际内容制作环境中的适用性。

Odd Eye 首席执行官崔顺范表示:“随着人工智能音乐市场的增长,重要的不是简单的创作,而是构建一个可持续的创意生态系统。”他补充道:“Vox Factory 将成为一个创意基础设施,能够在无需专业录音环境的情况下,快速实现各种风格的旋律和人声作品。”

Odd Eye 是一家语音人工智能公司,由韩国科学技术院 (KAIST) 音乐与音频计算实验室的人员创立。该公司曾开展过 Sumi Jo 二重唱表演和 Saebyul Park 合作等项目,目前正在准备推出下一代语音编辑解决方案“Gluent”。

Odd-Eye lance Vox Vox, une usine vocale IA qui « produit des voix simplement en fredonnant ».

Avec l’essor rapide de l’IA générative dans la production musicale, le marché de la production vocale basée sur l’IA connaît lui aussi une croissance exponentielle. La concurrence s’intensifie pour les « outils créatifs d’IA pratiques » qui, au-delà de la simple synthèse vocale, intègrent la composition, la production assistée et la création de contenu virtuel au sein d’un véritable flux de travail créatif.

La société AudiAi, spécialisée dans les solutions d’IA vocale, a officiellement lancé son service de synthèse vocale IA « VOX Factory » le 15.

Vox Factory est un service de synthèse vocale IA en ligne. Il prend en charge un environnement multilingue incluant le coréen, l’anglais et le japonais, ainsi que diverses intonations vocales. Il est conçu pour permettre aux créateurs individuels, tels que les compositeurs, les producteurs et les créateurs de contenu virtuel, de concrétiser rapidement leurs idées.

OddEye lance le synthétiseur vocal AI Vox Factory (Photo fournie par OddEye)

Melody commence par un simple fredonnement… Ajoutez simplement votre voix et l’IA complète les parties vocales.

La principale caractéristique de Vox Factory est « Démarrer à partir de

la voix ». Contrairement aux synthétiseurs vocaux traditionnels qui nécessitent d’abord une entrée de données MIDI, il est conçu de telle sorte que si l’utilisateur enregistre un fredonnement ou une simple note guide, l’IA puisse continuer à travailler sur la mélodie à partir de là.

La fonctionnalité « Smart Control », dévoilée simultanément, attire également l’attention. Contrairement aux synthétiseurs vocaux existants qui nécessitaient de nombreux paramètres détaillés, Vox Factory est conçu pour permettre aux utilisateurs de contrôler les nuances émotionnelles et les expressions à l’aide de seulement quatre paramètres principaux. L’entreprise explique que cela permet non seulement aux producteurs professionnels, mais aussi aux créateurs débutants, d’accéder plus facilement à l’environnement de production vocale basé sur l’IA.

Odd Eye s’est également attaché à garantir la stabilité des droits d’auteur. Toutes les propriétés intellectuelles vocales fournies par Vox Factory sont des actifs pour lesquels les droits vocaux ont été sécurisés, permettant ainsi aux créateurs de les utiliser commercialement sans problème de droits supplémentaires.

Ce service est proposé sous forme de SaaS (Software as a Service) accessible via le web. Les utilisateurs peuvent travailler dans un environnement cloud sans installer de programmes supplémentaires ; il prend en charge la collaboration sur des projets et la création de contenu multilingue.

Récemment, la concurrence dans le domaine des technologies de production vocale et de synthèse vocale utilisant l’IA générative s’est rapidement développée au sein de l’industrie musicale mondiale. Cependant, les questions relatives aux droits vocaux et au droit d’auteur, ainsi que l’intégration aux flux de production réels, demeurent des défis majeurs. L’industrie anticipe que la compétitivité future sur le marché de la musique basée sur l’IA dépendra non pas de la simple technologie de génération, mais de la facilité d’utilisation pour la création, de la stabilité de la propriété intellectuelle et de l’applicabilité dans des contextes de production de contenu réels.

Choi Soon-bum, PDG d’Odd Eye, a déclaré : « À mesure que le marché de la musique basée sur l’IA se développe, l’important n’est pas la simple génération, mais la construction d’un écosystème créatif durable », ajoutant : « Vox Factory deviendra une infrastructure créative capable de réaliser rapidement différents styles de mélodies et de travail vocal sans nécessiter un environnement d’enregistrement vocal professionnel. »

Odd Eye est une entreprise spécialisée dans l’intelligence artificielle vocale, fondée par des chercheurs du Laboratoire de musique et d’informatique audio de KAIST. Elle a notamment réalisé le duo de Sumi Jo et la collaboration avec Saebyul Park, et se prépare actuellement à lancer « Gluent », une solution de montage vocal de nouvelle génération.

0 views
Back to Blog

Related posts

Read more »

키네토스 “스포츠 강의는 디지털화되지 않은 마지막 시장”

키네토스 “스포츠 강의는 디지털화되지 않은 마지막 시장” 배경 이건우 키네토스 대표는 18일 서울 중구 은행회관에서 은행연합회 주최 ‘은행권 공동 소상공인 컨설팅 사업 성과 공유회’에서 위와 같이 밝혔다. 키네토스는 인공지능AI 기반 테니스 레슨 플랫폼으로, 개인 강사에게 회원 유치·...

[해시드와 AI 창업자③] GPTO가 ‘AI판 옥외광고’ 만드는 법

글로벌 웹3.0 벤처캐피털VC 해시드가 바이브코딩이라는 새로운 실험에 뛰어들었다. 바이브코딩은 지난해 2월 챗GPT 개발사 오픈AI 공동창업자이자 전 테슬라 인공지능AI 책임자 안드레이 카르파티가 X구 트위터에 올린 글 한 편에서 비롯됐다. 이는 코드의 존재조차 의식하지 않고 오롯이 감...

토스페이먼츠가 양자·AI 시대 보안을 준비하는 방법

인터뷰 — 신용석 토스페이먼츠 최고정보보호책임자CISO 토스페이먼츠는 결제 가용성을 지키는 보안 거버넌스를 바탕으로 양자내성암호PQC, 인공지능AI 기반 취약점 대응, 개인정보 영향평가 등 예방 중심 과제에 속도를 내고 있다. 신용석 CISO는 18일 바이라인네트워크와의 인터뷰에서 “...

리누스 토발즈, AI 도구 쓰는 버그 헌터들에 일침

리누스 토발즈가 리눅스 커널 7.1 릴리스 후보 버전을 배포하면서 AI 도구를 사용한 버그 헌터들을 향해 강한 입장을 밝혔습니다. 배경 - 2024년 4월 17일, 토발즈는 리눅스 7.1 RC4 배포 문서에서 “AI 기반 버그 보고서가 계속해서 쏟아지면서 보안 목록 관리가 거의 불가능해...