Alexa でのピッチコントロール手法を比較してみた

Alexa スキル開発SSML, ピッチ

Alexa にテキストを読ませると、たまに「こう読んでほしいのに…!」と思い通りにいかないときがあります。そりゃそうです、すべての言葉に対応するのは無理ですし、同音語があったり、人によって読み方が違ったりするのですから。

そんなときに使えるピッチのコントロールの手法を、試して比較してみました。

お題

今回のお題は次の2文。

それでは、お着替えをいたしましょう。

では、王子様、と、呼びかけてみましょう!

 
これらは、お姫様の国というスキルで使われている文章です。

コード

比較したコードはこの3種類ずつ。

var test1 = それでは、お着替えをいたしましょう。;
var test2 = それでは、お<prosody pitch="+30%">き</prosody><prosody pitch="medium">がえ</prosody>をいたしましょう。;
var test3 = それでは、<phoneme alphabet="x-amazon-pron-kana" ph="オキ'ガエ">お着替え</phoneme>をいたしましょう。;

var test4 = では、王子様、と、呼びかけてみましょう!;
var test5 = では、<prosody pitch="+30%">おー</prosody><prosody pitch="-10%">じ様</prosody>、と、呼びかけてみましょう!;
var test6 = では、<phoneme alphabet="x-amazon-pron-kana" ph="オ'ウジサマ">王子様</phoneme>、と、呼びかけてみましょう!;

ノーマルテキスト

var test1 = それでは、お着替えをいたしましょう。;
var test4 = では、王子様、と、呼びかけてみましょう!;

これは普通の方法ですね。

prosody pitch

var test2 = それでは、お<prosody pitch="+30%">き</prosody><prosody pitch="medium">がえ</prosody>をいたしましょう。;
var test5 = では、<prosody pitch="+30%">おー</prosody><prosody pitch="-10%">じ様</prosody>、と、呼びかけてみましょう!;

こちらはSSMLで、以下のリファレンスから詳細を見ることが出来ます。

+30% や -10% というところを変えることで、通常のピッチから幅を指定して上下させることができます。

phoneme alphabet

var test3 = それでは、<phoneme alphabet="x-amazon-pron-kana" ph="オキ'ガエ">お着替え</phoneme>をいたしましょう。;
var test6 = では、<phoneme alphabet="x-amazon-pron-kana" ph="オ'ウジサマ">王子様</phoneme>、と、呼びかけてみましょう!;

こちらは、Twitter で教えていただいた手法。

prosody pitch と同様、SSML のリファレンスにのっていました!

比較

ノーマルテキスト → prosody pitch → phoneme alphabet の順番にそれぞれのテキストを発話させるとこんな感じ。

結果

それでは、お着替えをいたしましょう。

 
これについては、聞いた時の「これだ感」で順位付けすると、phoneme alphabet > ノーマルテキスト > prosody pitchという順番。

では、王子様、と、呼びかけてみましょう!

 
一方こちらは、prosody pitch > phoneme alphabet > ノーマルテキストという順番。

もちろん、pitch の数値の塩梅や、タグの区切りによってまた変わるとは思いますが、言葉によってどれがいいかは変わるのでしょう。

もっと色んな言葉で試してみたいですね!

 

この記事が気に入ったら
いいね!しよう

最新情報をお届けします

Twitter でaoxaをフォローしよう!