最近よく見かける「21歳キャバ嬢〜」のようなナレーション付き動画は、AI音声とショート動画編集を組み合わせて作られているケースが多く、特定のアプリや声の仕組みを理解すると再現しやすくなります。本記事では、そうした動画で使われるAI読み上げの種類や、語尾の伸ばし方の仕組みについて解説します。
ショート動画で使われるAI読み上げの正体
いわゆる関西弁風やキャラクター風の音声は、AI音声合成(TTS:Text to Speech)によって作られています。
代表的なサービスには「VOICEVOX」「CoeFont」「TikTok内蔵音声」「音読さん」などがあります。
中でも自然な関西弁系はVOICEVOXの「ずんだもん関西風」やCoeFontのカスタム音声がよく使われます。
関西弁っぽいAI音声はどのアプリか
関西弁のように聞こえるAI音声は、実際には「標準語+イントネーション調整」で作られていることも多いです。
VOICEVOXではキャラごとに話し方の癖があり、関西弁に近いニュアンスを持つ音声も存在します。
またTikTokの内蔵音声機能でも、女性音声を加工してそれっぽく聞かせる手法が使われています。
語尾が伸びる音声の仕組み
語尾を「〜〜」のように伸ばす表現は、AIの音声生成時に「音素の長さ」を調整することで実現されています。
例えばVOICEVOXでは「…」や「ー」を入れることで自然に伸びた発音になります。
また編集ソフト側で音声を引き伸ばす(タイムストレッチ)方法もよく使われます。
実際の動画制作の流れ
一般的には「台本作成→AI音声生成→動画編集→字幕追加」という流れで制作されます。
CapCutやPremiere Proなどの編集ソフトに音声を入れ、テンプレートを使ってショート動画化します。
字幕は自動生成機能を使うことで効率的に作られることが多いです。
よくある再現のコツ
同じような動画を作る場合は、まず短いセリフをテンプレ化することが重要です。
またAI音声はそのまま使うよりも、ピッチやスピードを少し調整することで自然になります。
さらにBGMや効果音を重ねることで、より「バズ動画」に近い仕上がりになります。
まとめ
「21歳キャバ嬢〜」系の動画は、特別な技術ではなくAI音声と編集テンプレートの組み合わせで作られています。
関西弁風の音声は専用アプリだけでなく、標準音声の調整でも再現可能です。
仕組みを理解すれば、初心者でも同様のショート動画を制作できるようになります。


コメント