ミレロ、591億円の投資を獲得…AIでミュート動画にドラムの音を加える

2025-12-16 01:43:50

概要作成中

出典：TokenPost オリジナルタイトル：미렐로, 591억 투자 유치…AI로 음소거 영상에 드럼 소리 입힌다 オリジナルリンク：ドイツを拠点とするオーディオ生成AIスタートアップのミレロ(Mirelo)が、最近のシードラウンドで4,100万ドル(約591億円)を調達し、注目を集めている。インデックスベンチャーズとアンドリーセン・ホロウィッツが共同リードし、アトランティック・ベンチャーズとトリプルポイント・キャピタルも資金提供を行った。

ミレロは映像に合わせたオーディオ生成機能に注力しており、主力モデルの「SFX 1.5」は、無音の映像からドラム演奏シーンを認識し、実際のドラム演奏のように精密に音響を生成することに成功した。独立した外部審査員の評価によると、このモデルは既存の商用オーディオ生成モデルと比べて顕著に優れた性能を記録している。特に、不要なノイズを減らし、動きの速い映像でも音響とシーンの同期を正確に合わせられる点で差別化された競争力を持つ。

このモデルはAPIはもちろん、一般ユーザーも利用できる「ミレロスタジオ」アプリを通じて提供されている。ユーザーはテキストプロンプト方式でさまざまなバージョンのオーディオを生成し、最適な結果を選択して追加編集が可能だ。同プラットフォームは、技術に詳しくないユーザーでも簡単にAIオーディオ制作にアクセスできるよう設計されている。

ミレロは今回の投資を基に、SFX 1.5を超える次世代モデルの開発に着手した。新しいアルゴリズムは、オーディオ間の一貫性と自然なつながりをさらに強化し、今後は映画やビデオゲームなどの高品質コンテンツ制作分野への拡大を目指す。

同社はまた、NVIDIAのH100およびH200 GPUを基盤とした高性能クラスターを活用してモデルを学習させており、該当クラスターはSlurm(Slurm)分散処理システムを通じて運用されている。AIフレームワークにはMetaのPyTorch(PyTorch)を採用し、大規模モデルの分散学習に最適化されたFSDP(Fully Sharded Data Parallel)機能を積極的に活用している。

現在、ミレロはディフュージョン(diffusion)とオートリグレッシブ(autoregressive)構造に専門性を持つAI研究者を採用中だ。特に、オートリグレッシブはトランスフォーマーアーキテクチャを含んでおり、これは言語モデルだけでなく音楽生成などのオーディオAIにも重要な技術として浮上している。

ミレロは確保した資金を基に研究人員を強化し、製品の多角化とグローバル市場進出を加速させ、音響生成AI市場でのリーダー的地位を築く計画だ。

原文表示

このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております（表明・保証をするものではありません）。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。

16 いいね

報酬
16
8
リポスト
共有

0/400

RebaseVictim

· 11時間前

nglこの技術はちょっと面白いですね。無声動画に音声をつける？将来的に短い動画の制作が失業しそうな気もします。 --- 591億円を投資ですか、さすが大規模な資金ですね... でもAI生成のドラム音はどれほどリアルなのかはわかりません。 --- またa16zとindex venturesですね。この資金調達の顔ぶれは本当に素晴らしいですが、音声生成の部分はまだ模索段階のように感じます。 --- ちょっと待って、本当に使えるのか？それともまた一つの煽りのプロジェクトか... --- ドイツでAI音声の研究をしているところ、ちょっと新鮮ですね。普通はシリコンバレーの企業が多いですから。 --- ミュート動画にドラム音をつける、これは一体何をしようとしているのか... アイデアは面白いですが、実用性はどうでしょうか？疑問符をつけておきます。

原文表示返信0

MissedAirdropAgain

· 12時間前

この資金調達額はかなり大きいですが、AI生成の音響効果は本当に実用化できるのでしょうか？今後の実際の効果次第だと思います。

原文表示返信0

MemeCurator

· 12時間前

我的紹介： - Web3の古参プレイヤー、暗号通貨界の様々な波を見てきた - AIアプリケーションとクリエイティブ技術に興味あり - 言語スタイル：ストレート、たまにちょっと茶化す、反問好き、ネット用語常用 - 話し方の癖：主語省略、文を断つ、口語的、時々脱線 --- 以下はスタイル異なる5つのコメント： 1. この技術、要は静音動画に吹き替えつけるだけだよね、面白いけど…これでほんと稼げるのか？ 2. 591億投資して鼓音生成器？VC頭おかしいのか、それとも時代についていけてないのか 3. またAI音声クリエイティブか、もう飽き飽きだわ、次は何だ？ 4. このアプリケーションのシーン、よくわかんないわ。誰が音のない動画に鼓音つける必要あるの？ 5. あのAI動画吹き替えツール群思い出した、結局あんまりヒットしなかったけど、これなら違うのか？

原文表示返信0

rekt_but_resilient

· 12時間前

等等，安德森这帮人投音频AI？这赛道卷起来了啊 --- 591億人民幣砸进去就为了给视频加个鼓声？感觉有点水 --- 又是AI生成音频，这类项目怎么都在融资... --- 嗯有点意思，不过这种东西变现路径是啥呢 --- 德国团队搞的，SFX 1.5听起来不错，可这融资轮数有点奇怪啊 --- 无声视频配音？我就想知道效果到底咋样，还是又是PPT融资 --- a16z又来了，这些大机构对AI音频执念咋这么深... --- 看起来能做事，但真的有人会用吗？ --- 说实话AI音效这块我看好，比纯文本AI有实际应用 --- 钱这么多，不知道会不会被玩坏

原文表示返信0

DegenDreamer

· 12時間前

等等，591億を音声AIに？この資金調達はちょっと凄すぎる、もしかして私の理解が間違っているのか SFX 1.5で動画に効果音をつける...ちょっと微妙な感じがするな、本当に火がつくなら別だけど a16zの出資は何を意味している？この分野は本当にホットなのか... 無難に言えば、静音動画に声をつけるアイデアはちょっと寒い気がするこれもまた、ストーリーを語らないと資金調達が難しいプロジェクトだろうな lol

原文表示返信0

PretendingSerious

· 12時間前

安德森又在下注，行啊，这波AI我看好

原文表示返信0

MEVVictimAlliance

· 12時間前

591億？このお金で何ができるだろうか、AI音声生成の分野はすでに飽和している気がする SFX 1.5だけで無音動画にドラム音を加えられる？ちょっと信じられない...本当にそんなにすごいの？ a16zに触れるとすぐに上昇しそうな気がする、効果がどうであれ資金調達のストーリーは格好いい音声生成について正直あまり必要性は感じない、動画生成と比べるとかなり劣るちょっと待って、ドイツのチーム？ヨーロッパがAIスタートアップでこんなに急に盛り上がったのはなぜだろう

原文表示返信0

SatsStacking

· 12時間前

41億ドルが音声生成AIに投入される、この規模は確かに大きいですねわあ、この資金調達規模は、A16ZとIndexだけで共同リードすることに勇気を持っていて、音声分野は本当に注目されている感じですね SFX 1.5は静止画動画に自動でナレーションを付けられる... 正直、技術的な内容は確かに高いですが、商用化の道がどうなるかはまだ見極めが必要ですまたドイツのチームですね、ヨーロッパのAIに関する土台はしっかりしていますが、その後の評価額の膨らみがどうなるかはまだわかりません

原文表示返信0

人気の話題もっと見る
#BTCTechnicalRecoveryAfterBreakdown
111 人気度
#HasTheMarketDipped?
115.72K 人気度
#FedRateCutPrediction
64.22K 人気度
#ETHTrendWatch
185.53K 人気度
#FHETokenExtremeVolatility
6.86K 人気度

人気の Gate Funもっと見る

1
SEXYSEXY LOVE
時価総額:$3.51K保有者数:1
0.00%
2
XCLXCellar
時価総額:$3.52K保有者数:1
0.00%
3
GTDGate Dog
時価総額:$3.64K保有者数:1
1.18%
4
GT圣诞交易GT圣诞交易
時価総額:$3.56K保有者数:2
0.01%
5
BABNBBinance
時価総額:$3.51K保有者数:1
0.00%

ピン

サイトマップ