AIの声は人間より人間らしい?
みなさんこんにちは、GROWTH JAPAN TECHNOLOGIESの我妻です!
日本の宮城県仙台市は昨日16日は33℃でした。いやー真夏日でしたね。
本日も蒸し暑い!
夏が大好きな私としましては暑いと俄然やる気が止まらなくなるのですが、PCの熱暴走が止まらない今日この頃(笑)
AIの声は人間より人間らしい?
今回のテーマはAIの声は人間より人間らしい?です。
まずはこちらをご覧ください↓
はい!ご覧いただき、ありがとうございました!
こちらが弊社至極の渾身のプロモーションビデオです!
っではなくて、実は弊社プロモーションビデオの中には人のセリフが多数出てきますが、実際はどれも本当の人ではありません!本当なんです!私の声も入っておりません(当たり前ですが・・・)
実は全員がAIの声で収録したものです。
文章をリアルな音声に変換してテキスト読み上げができる高度なディープラーニング技術を採用しています。
このAIは自然に聞こえるように人間の音声を合成し、何十種類ものリアルな音声を多数の言語でサポートしているため、さまざまな国に対応した音声が生成できます!
実在しないけど、こんな声でこんなことを話したい!自分の代わりにクールにこんなことを流暢に話してもらいたいなど今までできなかったようなことが実現できるようになりました。
最近では駅の案内などもAI化されているので、どんどん普及しているイメージですね。
今回採用したAIはAWSのAmazon Polly
さてさてそんなAI事情ですが、今回プロモーションビデオで弊社が採用したのがAWSのAI「Amazon Polly」です。
Amazon Pollyはかなり性能が良いと個人的には感じており、この4、5年ですが、人の声が必要な場合はお力をお借りしております。
お客様の動画納品時にも好評いただくことも多く、重宝しております。
ただ、完全に流暢でない部分もあるので、その点はご了承ください。
※その場合は見方をかえて、これ実はAIが話しているんですよ。だから少しぎこちない感じなんです!
的な切り返しをするとウケが良いので試してみてください(笑)
Amazon Pollyは2022年8月時点で33言語に対応
ちなみにAmazon Pollyは2022年8月時点で33言語に対応しているようです。
こんな感じだそうです↓
※少し長くなります・・・
【Amazon Polly対応言語】
Arabic (arb)
Catalan (ca-ES)
Chinese, Mandarin (cmn-CN)
Danish (da-DK)
Dutch (nl-NL)
English (Australian) (en-AU)
English (British) (en-GB)
English (Indian) (en-IN)
English (New Zealand) (en-NZ)
English (South African) (en-ZA)
English (US) (en-US)
English (Welsh) (en-GB-WLS)
French (fr-FR)
French (Canadian) (fr-CA)
German (de-DE)
German (Austrian) (de-AT)
Hindi (hi-IN)
Icelandic (is-IS)
Italian (it-IT)
Japanese (ja-JP)
Korean (ko-KR)
Norwegian (nb-NO)
Polish (pl-PL)
Portuguese (Brazilian) (pt-BR)
Portuguese (European) (pt-PT)
Romanian (ro-RO)
Russian (ru-RU)
Spanish (European) (es-ES)
Spanish (Mexican) (es-MX)
Spanish (US) (es-US)
Swedish (sv-SE)
Turkish (tr-TR)
Welsh (cy-GB)
長い!っと思うほどたくさんサポートしているのですね。
さらに代表的なところですと以下のAIがいます。
【Amazon Polly代表例】
ポルトガル語 (ブラジル)
(女性)Vitória (スタンダード)
(女性)Vitória (ニューラル)
(男性)Ricardo
デンマーク語
(女性)Naja
(男性)Mads
英語
(女性)ジョアンナ (標準)
(女性)ジョアンナ (ニューラル)
(男性)マシュー (標準)
(男性)マシュー (ニューラル)
フランス語
(女性)Léa (スタンダード)
(女性)Léa (ニューラル)
(男性)Mathieu
日本語
(女性)Mizuki
(男性)Takumi (スタンダード)
(男性)Takumi (ニューラル)
韓国語
(女性)ソヨン (スタンダード)
(女性)ソヨン (ニューラル)
中国標準語
(女性)Zhiyu
スペイン語
(女性)Penélope
(男性)Miguel
日本語ですと女性のMizuki よりも男性のTakumiが私のおすすめです。
有機的なやさしい感じの印象なので(^^)/
ちなみに英語はどれも抜群の印象です!
それは私が英語が話せいないからすべて性能高く聞こえていることも影響しているかもしれませんが・・・
詳細につきましてはAWSのサイトをご覧ください。
https://docs.aws.amazon.com/polly/latest/dg/voicelist.html
っということで今回はAIの声は人間より人間らしい?でした。
いやー技術って使い方を間違えると大変なことになりますが、楽しく使うととっても面白いですね。
ぜひ、参考にしてみてください。
まとめは以下のとおりです。
まとめ
今のAIは自然に聞こえるように人間の音声を合成し、何十種類ものリアルな音声を多数の言語でサポートしている。
さまざまな国に対応した音声が生成することができる。
実在しないけど、こんな声でこんなことを話したい!など今までできなかったようなことが実現できるようになりました。
Amazon Pollyはかなり性能が良い。
Amazon Pollyは2022年8月時点で33言語に対応しています。
今回も記事をお読みいただき、ありがとうございました。
また、次回もどうぞ、よろしくお願いいたします。
お問い合わせ窓口
弊社製品・サービス等にご興味を持っていただきありがとうございます。
ご相談/お見積り依頼などございましたらお気軽にお問い合わせください。
コンテンツを評価する
楽しい時間を過ごしていただけましたか?
少しでも楽しい時間、面白い、ためになったと感じた場合は弊社SNSページへの「いいね」「フォロー」をしていただけますと幸いです。SNSページへのリンクは画面下部のフッターに用意しています!
みなさまからの評価を経て、コンテンツの改良を日々進めていきます。