【2024年8月版】主な生成AIツールの一覧まとめ

自己啓発

生成AIの能力が急速に拡大しているため、世の中に様々なツールがあふれている。一方、基本的には一番性能が良く使い勝手の良いツールをキャッチアップして使っておけば良い。
そもそも生成AIで今どんなことができるのか?そのために使うべきツールは?について調べたのでまとめておく。

生成AIができること

生成AIはプロンプトをインプットに何かを生成するツールである。ChatGPTが出たての2022年11月ごろは文書のみ生成できるツールだった。しかしその後、様々な技術が統合され、2024年8月現在で生成では以下のようなものを出力できるようになっている。

活用領域活用方法
文書生成自然言語処理技術を用いて、記事やブログ投稿の自動生成、要約、翻訳、カスタマーサポートでの自動応答などを行います。
AIによる対話システムやコンテンツ制作支援、ビジネス文書の作成支援など、幅広い文章関連業務を効率化。人間の書いた文章と遜色ない品質のテキストが得られます。
画像生成テキストを元にリアルな画像やイラストを自動生成。広告バナー、プロダクトデザイン、ソーシャルメディア投稿、コンセプトアートなど、クリエイティブなプロジェクトで活用。
新しいデザイン案の提案や、手作業では難しい複雑なビジュアルを短時間で生成することができ、ビジュアルコンテンツ制作を大幅に効率化します。
音声・音楽生成自然な音声や音楽をAIで生成し、ナレーション、ポッドキャスト、オーディオブック、音声アシスタント、BGM作成などに活用。
人間の声に近い音声や感情表現を持つ音声を作成可能で、音声コンテンツの品質向上に寄与。音楽生成では、特定のジャンルやムードに応じた音楽を自動生成し、クリエイティブな制作を支援します。
動画生成テキストや簡単な入力を元に、プロモーションビデオ、アニメーション、教育用コンテンツなどの動画を自動生成。手動では時間がかかる映像編集作業を効率化し、短時間でプロフェッショナルな映像を作成可能。
特にマーケティングや教育分野での活用が進んでおり、クリエイティブな映像制作の幅を広げます。

主な生成AIツールの一覧

2024年8月現在でそれぞれの領域における生成AIツールは以下の通り。

文書生成AI

基本的にはChatGPTを使っていれば良い。一方で、生成AIの開発者や企業における利用などではコスト・性能・安全面からGemini、Claudeも候補。

ツール開発企業概要説明
ChatGPTOpenAI広く一般に利用されている。GPT-4やマルチモーダルに対応し、ユーザーの質問に対する高度な自然言語応答が可能。
GeminiGoogle DeepMindGemini 1.5 Flashが発表され、非常に安価に利用可能。多言語対応や高度な推論能力を持ち、企業向けに広く採用されている。
ClaudeAnthropic人間の意図や倫理に焦点を当てた生成AI。安全性と透明性を重視しており、対話型アプリケーションに広く利用されている。
LlamaMetaオープンソースで利用できるモデル。日本語対応ではELYZAやCyberAgentがファインチューニングしたモデルを公開し、開発者に支持されている。

画像生成AI

DALL-Eの使い勝手が非常によく生成される画像も優秀。一方で、Midjourneyなどはカスタマイズ可能で細かい調整に向いている。

ツール開発企業概要説明
DALL-E 3OpenAI高品質な画像生成が可能なモデル。テキストからリアルな画像を生成する機能を持つ。ChatGPTからシームレスに利用できる点が大きなメリット。
MidjourneyMidjourneyアートスタイルに優れた画像生成AI。コミュニティを中心に発展しており、ユーザーが生成した画像を共有・評価するプラットフォームが整備されている。
Stable DiffusionStability AIオープンソースの画像生成モデルで、多様なスタイルや高解像度の画像を生成可能。幅広いカスタマイズが可能で、開発者コミュニティからの支持が厚い。
Adobe FireflyAdobeクリエイティブ業界向けに開発された画像生成ツール。Adobeの他の製品との統合が進んでおり、デザインワークフローの中で活用されることが多い。

音声・音楽生成AI

歌詞を入れるだけでかなり高精度なオリジナル音楽を作って歌ってくれるsunoが非常に使い勝手が良い。udioなども広く活用されていて、音楽作るだけであればこの2つが良い。

ツール開発企業概要説明
sunosunoリアルタイムでの音声生成と操作が可能な次世代音楽ツール。独自の音楽生成アルゴリズムを使用し、ライブパフォーマンスや即興音楽の制作に利用されている。
LLElevenLabsEleven Labs高品質な音声生成AI。自然で表情豊かな音声を生成でき、ナレーションやオーディオブックの制作に利用されている。
udioudioAIを用いた音楽生成ツール。簡単な操作で楽曲を作成でき、音楽制作初心者からプロフェッショナルまで幅広く利用されている。

動画生成AI

soraの発表があってから動画生成AI市場は次の注力領域になっている印象。これまでは3秒程度の動画しか作れなかったが、SoraやKlingでは30秒を超える非常に長い動画を作れるようになってきている。

ツール開発企業概要説明
SoraOpenAIAIを使った映像生成ツール。簡単な指示でアニメーションや動画を生成でき、企業のプロモーションビデオや教育コンテンツに利用されている。
KlingKuaishou(快手)高度なAIアルゴリズムを使用して、プロフェッショナルな映像を簡単に生成できるツール。映画制作や広告業界での利用が増加している。
Dream MachineLuna AIクリエイティブなコンテンツ制作向けの映像生成ツール。ユーザーが提供するアイデアを元に、リアルな映像やアニメーションを自動生成する機能が特徴。
Runway Gen3Runway画生成AIの中でも特に高精度でリアルな動画を生成することができ、クリエイティブなプロジェクトに革命をもたらすツールとして注目されています。
VrewVoyagerX動画編集ツールとして、AIを活用した字幕生成や自動カット機能を備えている。日本語対応で、YouTuberや企業の動画制作で人気を集めている。
LTX StudioLightricks物語のあらすじを入力するだけで、スクリプト作成からカメラ制御、キャラクター設定、編集までを一貫して行うことができるツールを提供している。

まとめ

ChatGPTを筆頭に、2023年は文書生成AIが市場をけん引していた。しかし、2023年後半から画像生成・動画生成の市場に広がりを見せている。特に、2024年は動画生成AIの発展が目まぐるしく、1プロンプトで30秒を超える動画を生成できるようになってきている。
2024~2025年は、技術領域として画像+音声から動画生成への広がりと併せ、ビジネス領域としてクリエイティブ制作からコンシューマや業務活用へ広がっていくと想像される。

コメント