昨年12月初め、OpenAGI財団が大きな動きを見せました——「Lux」と名付けられた基盤モデルを発表したのです。このプロジェクトはなかなか興味深く、AIに「人間のようにマウスをクリックしたりキーボードを打ったり」させることを目的とした、初のオープンソースソリューションと謳われています。



簡単に言えば、これまでAIがどんなに賢くてもAPIインターフェースを通じてしか作業できませんでしたが、Luxは直接ソフトウェアのUIを操作できるようになりました。彼らは日常の300のタスクシナリオでテストを行い、その結果は非常に優秀でした。業界でよく使われるベンチマーク「Online-Mind2Web」では83.6%というスコアを記録しています。

他と比較するとその価値がわかります——ある大手検索企業のGemini CUAは69%、あるチャットボット企業のOperatorは61.3%、AIアシスタントを主力とする企業のClaude Sonnetですらこのスコアを超えることはできませんでした。

オープンソースという道は確かに意義があります。少なくとも、より多くの開発者が「AIによる自動PC操作」という分野に触れるためのハードルを下げてくれました。
原文表示
このページには第三者のコンテンツが含まれている場合があり、情報提供のみを目的としております(表明・保証をするものではありません)。Gateによる見解の支持や、金融・専門的な助言とみなされるべきものではありません。詳細については免責事項をご覧ください。
  • 報酬
  • 6
  • リポスト
  • 共有
コメント
0/400
LiquidatedTwicevip
· 20時間前
くそ、Luxのこのデータ本当か?83.6%でClaudeを圧倒してる?ちょっと信じられないな。
原文表示返信0
PuzzledScholarvip
· 20時間前
83.6%という数字はちょっと怖いですね、AIが本当に「自分で作業」し始めた感じがします。 --- オープンソースはまさにユーザーの福音ですね。以前はこういったものが大手企業にロックされていましたから。 --- え、Luxは直接インターフェース操作できるの?それじゃあ自分の仕事がなくなっちゃうよ。 --- Claude Sonnetがやられちゃったのは、ちょっと気まずいですね。 --- 300のタスクシナリオでテストした結果って信じていいのかな、なんだか水増しされている気がする。 --- やっぱりオープンソースのソリューションに注目するべきですね、商用AIはどれもこれも極端すぎます。 --- マウスをクリックしたりキーボードを叩いたり、一見簡単そうだけど、ここまで実用化できるのはやっぱりすごい。 --- これが成熟したら、多くの単純作業が本当になくなってしまいそうですね。
原文表示返信0
SmartContractRebelvip
· 21時間前
83.6%という数字は本当に驚きで、あのクローズドソースの大手企業のソリューションを圧倒しています。 オープンソース版がClaudeを超えているなんて、どういうことでしょうか?大手企業はもしかしてサボっていたのかもしれませんね(笑) 本当に気になるのは、300のタスクシナリオが十分リアルなのかどうか……やはり時間が証明する必要がありそうです。 こういうAIが自動でコンピューターを操作するものが普及したら、私たちのような作業員は失業してしまうのでしょうか。 Luxという名前のセンスも良いですね、聞いただけで「光明」な感じがして、オープンソースが世界を救うという暗示でしょうか。 今回、財団は本当に誇張せずに、データを見せてくれましたし、公式発表会のPPTよりもずっと信頼できます。 2024年のAIベンチマークはもう冗談みたいなものになりそうです。Luxが登場してランキングを一気に変えてしまいました。
原文表示返信0
CommunityWorkervip
· 21時間前
83.6%が他を完全に圧倒しているけど、オープンソースって本当にそんなに強いの?なんだかちょっと怪しい気がする。
原文表示返信0
SandwichVictimvip
· 21時間前
83.6%というこのデータは本当に驚異的で、GeminiやClaudeを直接圧倒している。オープンソースモデルがついに逆転の兆し? --- これは本当にオープンソースコミュニティの勝利だ。ついに誰かがこの偉業を成し遂げた。 --- ちょっと待って、直接インターフェースを操作できるって、これRPAの究極進化じゃない?これが普及したら、ちょっと怖い気もする。 --- Claude Sonnetよりもすごい?なんかちょっと誇張しすぎな気がするけど。 --- オープンソース万歳。そろそろ大手企業の独占状態を打破する時が来た。 --- マウスを直接クリックしたりキーボードを打ったり…これが本当に普及したら、多くの仕事が震え上がることになるだろうね。
原文表示返信0
alpha_leakervip
· 21時間前
83.6% で Gemini と Claude を直接圧倒、このオープンソースはすごい、ついに誰かが AI にパソコン操作をやらせることに成功した
原文表示返信0
  • ピン