出典:TokenPost
オリジナルタイトル:미렐로, 591억 투자 유치…AI로 음소거 영상에 드럼 소리 입힌다
オリジナルリンク:
ドイツを拠点とするオーディオ生成AIスタートアップのミレロ(Mirelo)が、最近のシードラウンドで4,100万ドル(約591億円)を調達し、注目を集めている。インデックスベンチャーズとアンドリーセン・ホロウィッツが共同リードし、アトランティック・ベンチャーズとトリプルポイント・キャピタルも資金提供を行った。
同社はまた、NVIDIAのH100およびH200 GPUを基盤とした高性能クラスターを活用してモデルを学習させており、該当クラスターはSlurm(Slurm)分散処理システムを通じて運用されている。AIフレームワークにはMetaのPyTorch(PyTorch)を採用し、大規模モデルの分散学習に最適化されたFSDP(Fully Sharded Data Parallel)機能を積極的に活用している。
ミレロ、591億円の投資を獲得…AIでミュート動画にドラムの音を加える
出典:TokenPost オリジナルタイトル:미렐로, 591억 투자 유치…AI로 음소거 영상에 드럼 소리 입힌다 オリジナルリンク: ドイツを拠点とするオーディオ生成AIスタートアップのミレロ(Mirelo)が、最近のシードラウンドで4,100万ドル(約591億円)を調達し、注目を集めている。インデックスベンチャーズとアンドリーセン・ホロウィッツが共同リードし、アトランティック・ベンチャーズとトリプルポイント・キャピタルも資金提供を行った。
ミレロは映像に合わせたオーディオ生成機能に注力しており、主力モデルの「SFX 1.5」は、無音の映像からドラム演奏シーンを認識し、実際のドラム演奏のように精密に音響を生成することに成功した。独立した外部審査員の評価によると、このモデルは既存の商用オーディオ生成モデルと比べて顕著に優れた性能を記録している。特に、不要なノイズを減らし、動きの速い映像でも音響とシーンの同期を正確に合わせられる点で差別化された競争力を持つ。
このモデルはAPIはもちろん、一般ユーザーも利用できる「ミレロスタジオ」アプリを通じて提供されている。ユーザーはテキストプロンプト方式でさまざまなバージョンのオーディオを生成し、最適な結果を選択して追加編集が可能だ。同プラットフォームは、技術に詳しくないユーザーでも簡単にAIオーディオ制作にアクセスできるよう設計されている。
ミレロは今回の投資を基に、SFX 1.5を超える次世代モデルの開発に着手した。新しいアルゴリズムは、オーディオ間の一貫性と自然なつながりをさらに強化し、今後は映画やビデオゲームなどの高品質コンテンツ制作分野への拡大を目指す。
同社はまた、NVIDIAのH100およびH200 GPUを基盤とした高性能クラスターを活用してモデルを学習させており、該当クラスターはSlurm(Slurm)分散処理システムを通じて運用されている。AIフレームワークにはMetaのPyTorch(PyTorch)を採用し、大規模モデルの分散学習に最適化されたFSDP(Fully Sharded Data Parallel)機能を積極的に活用している。
現在、ミレロはディフュージョン(diffusion)とオートリグレッシブ(autoregressive)構造に専門性を持つAI研究者を採用中だ。特に、オートリグレッシブはトランスフォーマーアーキテクチャを含んでおり、これは言語モデルだけでなく音楽生成などのオーディオAIにも重要な技術として浮上している。
ミレロは確保した資金を基に研究人員を強化し、製品の多角化とグローバル市場進出を加速させ、音響生成AI市場でのリーダー的地位を築く計画だ。